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Cuvânt înainte 


Procesarea imaginilor este un domeniu relativ recent, care evoluează rapid. 
Aplicațiile sale se întâlnesc pretutindeni: în medicină, armată, industrie, 
artă sau acolo unde informaţia din mediul înconjurător este reprezentată sub 
formă de imagini. Principala aplicaţie o reprezintă îmbunătăţirea informaţiei 
conţinute de imagini în vederea, interpretării de către un subiect uman sau 
pentru vederea artificială a roboților. 


Odată cu răspândirea. aparatelor de fotografiat digitale, procesarea ima- 
ginilor nu mai este domeniul exclusiv al oamenilor de ştiinţă, sau al ingine- 
rilor. Aplicațiile de procesare a imaginilor au pătruns in casa oricărui fo- 
tograf amator, fiind utilizate pentru retuşarea fotografiilor digitale. 


Îndrumarul de faţă se adresează în special studenţilor de la facultăţile 
tehnice, care urmează cursul de Procesarea imaginilor, dar şi celor care 
doresc sà îşi însuşească algoritmii fundamentali de procesare a imaginilor. 
Lucrările de laborator prezentate abordează operaţiile punctuale, de vecină- 
tate şi cele integrale, de la accentuarea contrastului până la transformări 
unitare. Ultimul capitol, referitor la segmentarea imaginilor, reprezintă o 
incursiune în domeniul analizei imaginilor. 


Scopul lucrărilor de laborator este acela de a prezenta noţiunile funda- 
mentale de procesare a imaginilor alb-negru şi de a exemplifica folosind lim- 
bajul C++ modalităţi de implementare a algoritmilor de procesare prezentaţi. 
Pentru o înţelegere cât mai bună a soluţiilor propuse, cititorul trebuie să fie 
familiarizat cu limbajele de programare C şi C++. 


Lucrarea 1 


Notiuni introductive de Qt 


Qt! este un mediu de dezvoltare care include biblioteci de clase C++ si 
unelte de dezvoltare de aplicaţii pentru diverse sisteme de operare: Microsoft 
Windows, MAC OS sau Linux. 

Bibliotecile Qt cuprind peste 400 de clase C++, care incapsuleazá in- 
frastructura necesară pentru dezvoltarea de aplicaţii. Qt API? include clase 
pentru realizarea de interfeţe grafice utilizator, pentru programarea în reţea, 
baze de date sau integrare OpenGL’. 


1.1 Clasa QApplication 


Clasa QApplication controlează şi gestionează interfaţa, grafică a unei aplica- 
tii. Conţine bucla principală de evenimente a aplicaţiei, în care sunt proce- 
sate evenimentele provenind de la sistemul de ferestre. De asemenea ges- 
tioneazá configurările aplicaţiei, fazele de initializare şi terminare a aplicaţiei. 

Orice aplicaţie Qt este un obiect QApplication indiferent de numărul de 
ferestre ale aplicaţiei. Obiectul este accesibil prin apelarea funcţiei membre 
instance (), care returnează un pointer către acest obiect. 


1.2 Clasa QImage 


Clasa, Qlmage pune la dispoziţie o reprezentare independentă de platformă 
a unei imagini, care permite accesul direct la valorile pixelilor. Qt oferă 
patru clase pentru manipularea imaginilor: QImage, QPixmap, QBitmap şi 
QPicture. 

Clasa QImage este proiectată şi optimizata pentru operaţii de intrare/ieşi- 
re şi pentru acces direct la pixelii imaginii, pe când clasa QPixmap este proiec- 
tata şi optimizata pentru vizualizarea imaginilor pe ecran. Clasa QBitmap 


l'Trolltech, http:/ /www.trolltech.com 
? Application Program Interface. 
?Limbaj de graficá 3D dezvoltat de firma Silicon Graphics. 
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moşteneşte clasa. Pixmap şi este folosită pentru imagini binare, iar clasa 
QPicture este un “paint device”. În continuare ne vom concentra atenţia 
asupra clasei QImage. 

Clasa QImage poate manipula o serie de formate de imagine, care includ 
fie imagini monocrome, fie reprezentate pe 8 biţi sau 32 biţi. Clasa pune 
la. dispoziţie o colecţie de funcţii care pot fi folosite pentru obţinerea de 
informaţii despre imagine sau care permit anumite transformări ale imaginii. 


1.2.1 Manipularea imaginilor 


Clasa QImage oferă câteva moduri de а încărca o imagine dintr-un fişier: la 
instantierea obiectului QImage sau folosind funcţiile loadFromData() sau 
load(), care vor fi apelate după crearea obiectului QImage. Pentru a salva 
un obiect de tip QImage se foloseşte funcţia save (2. 

Următorul exemplu ilustrează folosirea funcţiei load О: 


Qlmage image; 
QString filename = QFileDialog :: getOpenFileName() ; 
image.load( filename, 0 ); 


Lista completá a formatelor de figiere cunoscute este disponibilá prin 
intermediul a două metode: QImageReader: :supportedImageFormats() si 
QImageWriter: :supportedImageFormats(). Implicit, Qt suportă urmátoa- 
rele formate de fişiere: 


Format | Descriere Operatii 
BMP Windows Bitmap Read/Write 
Graphic Interchange Format (optional) | Read 
Read/Write 
Read/Write 
Read/Write 
Read 
Read 
Read/Write 
Read/Write 
Read/Write 


Joint Photographic Experts Group 
Joint Photographic Experts Group 
Portable Network Graphics 
Portable Bitmap 

Portable Graymap 

Portable Pixmap 

X11 Bitmap 

X11 Pixmap 


Tabelul 1.1: Formate de fisiere imagine suportate de Qt. 


1.2.2 Atribute ale imaginii 


QImage ofera o colectie de functii pentru obtinerea de informatii despre 
atributele imaginii, cum ar fi geometria imaginii sau informatii despre paleta 
de culori. 
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Geometrie | Funcţiile size(), width(), heightO, 
dotsPerMeterX() şi dotsPerMeterY() 
oferá informatii despre dimensiunile si as- 
pectul imaginii. 


Culoare Culoarea unui pixel poate fi aflatá spe- 
cificând coordonatele pixelului funcţiei 
pixel(), care returnează culoarea ca 
o valoare QRbg. În cazul imagini- 
lor monocrome sau cu nivele de gri, 
funcţiile numColors() şi colorTable 
oferà informatii despre componentele de 
culoare ale imaginii. 


Nivel jos Funcţia depth() returnează numărul de 
biţi pe care este reprezentată valoarea 
unui pixel: 1 (imagini monocrome), 8 sau 
32. Funcţiile format (), bytesPerLine() 
şi numBytes() oferă informaţii despre 
modul de stocare a imaginii. 


Tabelul 1.2: Funcţii de aflare a atributelor unei imagini. 


1.2.3 Manipularea pixelilor 


În cazul în care culorile pixelilor sunt stocate pe 32 biţi, funcţia setPixel 
se poate utiliza pentru modificarea valorii unui pixel specificat prin coor- 
donatele sale. Noua sa valoare este un cvadruplu ARGBĂ, fiind unul din 
argumentele functiei. Pentru a specifica valoarea unui pixel in modelul RGB 
se foloseste functia qRgb care returneazá un obiect QRgb. 

În continuare este prezentat un exemplu de folosire a funcţiei setPixel. 
Se crează mai întâi un obiect QImage, reprezentând o imagine de dimensiune 
3 x 3. 


QImage image(3, 3, QImage::Format RGB32); 
QRgb value; 


value - qRgb(189, 149, 39); // Oxffbd9527 
image.setPixel(1, 1, value); 


value = qRgb(122, 163, 39); // Oxff7aa327 
image.setPixel(0, 1, value); 
image.setPixel(1, O, value); 


^ Alpha Red Green Blue. 
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value = qRgb(237, 187, 51); // Oxffedba31 
image.setPixel(2, 1, value); 


1.2.4 Formate de imagine 


Fiecare pixel stocat intr-un obiect de tip QImage este reprezentat ca un 
intreg. Dimensiunea acestui intreg depinde de format. Qt suportà imagini 
monocrome, reprezentate pe 1 bit si imagini reprezentate pe 8 sau 32 biti. 

Imaginile monocrome sunt stocate folosind indici de 1 bit intr-o tabelá 
de culoare cu doar două intrări (culori). In funcţie de ordinea de stocare 
a bitilor, big endian sau little endian, diferentiem două tipuri de imagini 
monocrome. 

Imaginile reprezentate pe 8 biţi sunt stocate folosind indici de 8 biţi 
într-o tabelă de culoare, având un byte per pixel. Tabela de culoare este un 
obiect QVector<QRgb>. 

Imaginile reprezentate pe 32 biţi nu au tabelă de culoare, fiecare pixel 
conţinând o valoare QRgb. Cea mai răspândită modalitate de a reprezenta 
tripletul RGB pe 32 biţi este următoarea: OxffRRGGBB, în care se folosesc 
câte 8 biţi pentru fiecare componentă. 

Formatul unei imagini se poate determina folosind funcţia format O. 

Pentru a converti o imagine într-un nou format se foloseşte funcţia 
convertToFormat (), care acceptă ca argument noul format al imaginii. 


Lucrarea 2 


Notiuni introductive de 
prelucrarea imaginilor 


BREVIAR TEORETIC 


2.1 Percepția imaginilor 


Înțelegerea procesului de percepţie a imaginilor de către ochiul uman este 
foarte importantă pentru dezvoltarea de tehnici de evaluare a calităţii unui 
sistem sau algoritm de procesare a imaginilor. Informaţia la nivel vizual, 
conținută de către o imagine, reprezintă o distribuţie spaţială a unei anumite 
mărimi, cum ar fi de exemplu luminanta obiectelor ce compun respectiva 
imagine. Informaţia percepută de ochiul uman poate fi definită de atribute 
cum ar fi strălucirea, culoarea sau muchiile unui obiect. 


2.1.1 Structura ochiului uman. Formarea imaginii 


Ochiul uman are o formă aproape sferică, având un diametru, în medie, 
de aproximativ 2 cm. Este format din mai multe membrane: corneea şi 
sclerotica, ca înveliş exterior, şi coroida şi retina în interior. Corneea este un 
ţesut dur şi transparent, pe când sclerotica este o ţesut opac. Coroida se află 
imediat sub sclerotica şi contine o reţea de vase de sânge, ce hrănesc ochiul. 
Este puternic pigmentatá pentru a reduce excedentul de lumină ce intră în 
ochi. Pe cea mai din interior membrană, retina, se formează imaginea, sub 
influenţa. luminii reflectate de obiectele exterioare ochiului. 

Retina contine două tipuri de receptori: conuri şi bastonase. Conurile, 
în număr de aproximativ 6-7 milioane, servesc la percepţia culorilor. Ve- 
derea umană, poate percepe detalii foarte fine datorită densităţii mari a aces- 
tor receptori, fiecare con fiind legat la o terminatie nervoasă. Bastonasele, 
în număr de aproximativ 75-150 milioane, servesc vederii crepusculare, in 
condiţii de iluminare slabă. Acestea sunt răspândite pe o arie mare şi conec- 
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tate la doar câteva terminatii nervoase, ceea ce are ca efect reducerea con- 
siderabilá a perceperii detaliilor din imagine. 

Cristalinul joacá rolul de lentilá. El contine aproximativ 7096 apá gi, prin 
compozitia lui, permite trecerea a doar 8% din spectrul de radiatie vizibilá, 
absorbind în bună măsură şi radiaţiile infrarogii şi ultraviolete. 

Imaginea obiectelor se proiectează pe retină, prin cristalin, fiind răsturna- 
tă şi având dimensiuni mult mai mici, principiu ce stă la baza aparatului de 
fotografiat (vezi Figura 2.1). 


Figura 2.1: Formarea imaginii în aparatul de fotografiat: 1-lentila, 2-camera 
obscură, 3-obiectiv, 4-peliculá. 


2.1.2 Lumina. Luminanta. Strálucirea 


Lumina este o radiaţie electromagnetică ce stimulează receptorii de la nivelul 
retinei. Ea se exprimă ca fiind o distribuţie L(A) de energie, unde À este 
lungimea de undă a radiaţiei, în cazul nostru vizibilă, cu valori între 350 şi 
780 nm. Lumina percepută de la un obiect se poate scrie matematic astfel: 


IQ) = Р(А)І(А) (2.1) 


unde р(А) reprezintá másura in care un obiect reflectá sau transmite 
energia luminoasă incidentă, a cărei distribuţie este exprimată prin L(A). 

Luminanta sau intensitatea luminoasă a unui obiect cu o distribuţie 
spaţială a luminii, I(x, y, А), se defineşte astfel: 


Желе ү. Тај CA (2.2) 
0 


unde V (A) este funcţia de eficienţă luminoasă relativă a sistemului vizual. 
Pentru ochiul uman, V(A) este o curbă de tip clopot, a cărei caracteristici 
depind de la o persoană la alta (vezi Figura 2.2). 
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Functia de eficienta luminoasa relativa 


400.0 440.0 480.0 520.0 560.0 600.0 640.0 680.0 720.0 760.0 
2 1.2 


14 — — Eficienta relativa 14 


V (lambda) 
o 
o 


400.0 440.0 480.0 520.0 560.0 600.0 640.0 680.0 720.0 760.0 


lambda (nm) 


Figura 2.2: Forma tipică a funcţiei de eficienţă luminoasă relativă. 


Luminanta unui obiect; este independentă de luminanţa obiectelor din 
jur. 

Strălucirea unui obiect este luminanta percepută şi depinde de luminanta 
mediului ambiant obiectului. Două obiecte aflate într-un acelaşi ambient pot 
avea aceeaşi luminanta, dar străluciri diferite. 


2.2 Modelul matematic al imaginii 


2.2.1 Modelul continuu al imaginii 


Matematic imaginile pot fi reprezentate ca o funcţie de două variabile, în 
spaţiul L2(R2), astfel: 


e imaginile în tonuri de gri se pot modela cu: f(x,y): А? — Б, caz 
în care valorile funcţiei f reprezintă valorile luminantei obiectelor din 
imagine, în punctele (x,y) ale spaţiului. 


e imaginile color se pot modela cu: f(x,y) : R? — Б, caz in care 
valorile functiei f reprezintà vectori de 3 componente dintr-un spatiu 


al culorilor. De exemplu pot fi cele trei componente ale modelului 
RGB!. 


Spaţiul L?(R?) poate fi limitat la un domeniu finit D, ca în Figura 2.3. 


1RGB = (engl.) Red Green Blue. 
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D 


Figura 2.3: Domeniu finit din R?. 


2.2.2 Modelul discret al imaginii 
Acesta este modelul utilizat în practică. Funcţia f ia valori discrete, fiind 
deasemenea, definită pe un domeniu de valori discrete, adică: 

f(k, D) : Z2 2+ sau f(k,l): Z2— Zt (2.3) 


'Ттесегеа de la domeniul continuu la domeniul discret se face prin esantio- 
nare si cuantizare. 


2.3  Eşantionarea imaginilor 


Pentru a putea prelucra cu ajutorul unui calculator o imagine f(x,y), aceasta 
trebuie discretizată spaţial şi în amplitudine. Discretizarea coordonatelor 
spatiale (2, у) poartă numele de esantionare. 

Esantionarea reprezintă procesul de aproximare a unei imagini continue 
f(x,y) cu o matrice de dimensiune MaN, astfel: 


f(x,y) ғ . А к. : (2.4) 
FUN — 1,0) IN- 1,1) К РМ — b 1) 


Teorema esantionárii: O imagine /(т,у), ауапа un spectru finit, 
esantionatà uniform cu o reţea dreptunghiulară de forma celei din Figura 
2.4 poate fi refăcută fără eroare din eşantioanele f(móx,nóy) cu ajutorul 
formulei de interpolare: 


f(s;y) = 22. P f(măz, này) (mmm C) 
(2.5) 
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unde us şi v, reprezintă, frecvențele spatiale de egantionare. 
Egalitatea dată de teorema eşantionării este valabilă dacă şi numai dacă, 
este respectată condiţia Nyquist, şi anume: 


1 1 
ay eT 2uo, a = Us > 200 (2.6) 


unde up si vo reprezintá frecventele spatiale maxime care apar in imagine. 


n 
dx 
[9] [9] | | O O O 
O O O O O O O 
O O О [9] O "7 d 
[9] о [9] [9] О TEE ОУ 
O O О O O O O 
O O O O O O O m 


Figura 2.4: Reţea dreptunghiulară de egantionare. 


Cu alte cuvinte, frecvențele spatiale de eşantionare trebuie să fie cel putin 
dublul frecvenţelor spaţiale maxime conţinute de imagine. 


2.4  Cuantizarea imaginilor 


Cuantizarea este procesul de discretizare a valorilor funcţiei f (x, y). Aceasta 
se realizează de obicei cu ajutorul unei funcţii de tip scară, de forma, celei 
din Figura 2.5. 

Astfel, tuturor valorilor lui z dintr-un interval li se atribuite valori dis- 
crete k. Cuantizarea este un proces însoţit de zgomot, cunoscut sub numele 
de eroare de cuantizare. Cea mai utilizată metodă de cuantizare este cea 
uniformă, ceea ce înseamna că intervalele funcţiei de cuantizare sunt egale. 


2.5 Imaginile digitale 


Imaginile astfel discretizate reprezintă structuri bidimensionale de date, de- 
numite imagini digitale. Un element (k,/) al imaginii poartă numele de 
pizeb. 


?pixel = (engl. picture + element). 


10 LUCRAREA 2. NOTIUNI INTRODUCTIVE 


4 


k 


Figura 2.5: Exemplu de funtie de cuantizare. 


Imaginile digitale pot fi stocate în memoria sau pe discul unui sistem 
de procesare si analiză a imaginilor, în vederea vizualizárii sau prelucrării 
ulterioare. Pe disc imaginile sunt stocate sub forma unor figiere. Fisierele 
pot fi de mai multe feluri, în funcţie de formatul în care păstrează datele ce 
reprezintă imagini: BMP, JPEG, GIF, TIFF, etc. 

Cel mai simplu format de fisier imagine este Windows Bitmap (BMP) 
al firmei Microsoft. Acesta este formatul în care o imagine digitală este 
stocatà practic fárà nici un fel de codare sau pierdere de informatie, cu 
excepția reprezentării binare. 


DESFÁSURAREA LUCRĂRII 


În continuare este prezentat codul C++ al unei aplicati care citeşte o imag- 

ine în format BMP si o afiseazà într-o fereastră pe ecran. Aplicația este 

dezvoltată utilizând bibliotecile Qt (Linux). Cititi şi intelegeti codul. 
Fişierul aplicatie.h conține declararea clasei ImageViewer. 


#ifndef APLICATIE_H 
#define APLICATIE_H 


#include «qwidget.h» 
#include <qimage.h> 
#include <qpainter.h> 
#include <qlabel.h> 


class QMenuBar; 
class QPopupMenu; 


class ImageViewer : public QWidget 
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{ 
Q_OBJECT 
public: 
ImageViewer( QWidget *parent = 0, const char *name = 0, 
int wFlags = 0 ); 
~ImageViewer () ; 
bool loadImage( const char *fileName ); 
protected: 
void paintEvent( QPaintEvent * ); 
private: 
int conversion_flags; 
int alloc_context; 
QImage image; 
QPixmap pm; 
QMenuBar *menubar; 
QPopupMenu *file; 
QLabel *status; 
bool reconvert Image () ; 
private slots: 
void openFile( void ); 
void saveFile( void ); 
Б 


#endif // APLICATIE H 


Fişierul aplicatie.cpp contine definitiile funcţiilor membre clasei Im- 
ageViewer. 


#include "aplicatie.h" 
#include <qmenubar.h> 
#include <qfiledialog.h> 
#include <qmessagebox.h> 
#include <qpopupmenu.h> 
#include <qpainter.h> 
#include <qapplication.h> 
#include <qwidget.h> 


ImageViewer :: ImageViewer( QWidget *parent, const char *name, 
int wFlags ) : QWidget( parent , name , wFlags ), 


conversion flags( PreferDither ), filename( O ) 


alloc context = 0; 
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menubar = new QMenuBar( this ); 
menubar->setSeparator( QMenuBar :: InWindowsStyle ); 


file = new QPopupMenu(); 
CHECK_PTR( file ); 
menubar->insertltem( "&File" , file ); 
file->insertItem( "Open image ( BMP )", this, 
SLOT( openFile() ), CTRL+Key_0 ); 
file->insertSeparator () ; 
file->insertltem( "Save as ... ( BMP )", this, 
SLOT( saveFile() ), CTRL+Key_S ); 
file->insertSeparator () ; 
file->insertItem( "Quit", gApp, SLOT(quit О), CTRL+Key_Q ); 


status = new QLabel( this ); 
status->setFrameStyle( QFrame::WinPanel | QFrame::Sunken ); 


status->setFixedHeight ( fontMetrics().height() + 4 ); 


setMouseTracking( TRUE ); 


} 
ImageViewer :: ^ImageViewer() 
1 
if ( alloc, context ) 
QColor :: destroyAllocContext( alloc, context ); 
delete menubar; 
delete file; 
delete help; 
delete status; 
} 
void ImageViewer :: openFile() 
1 
QString newfilename = QFileDialog :: getÜpenFileName(); 
if ( !newfilename.isEmpty() ) 
1 
loadImage( newfilename ); 
repaint(); 
b 
} 


void ImageViewer :: saveFile( void ) 
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t 
QImagelO0 iio; 
QString save as file - QFileDialog :: getSaveFileName(); 
if( !save as file.isEmpty() ) 
i 
iio.setImage( image ); 
iio.setFileName( save. ав file ); 
iio.setFormat( "BMP" ); 
iio.write(); 
} 
J 
bool ImageViewer :: loadImage( const char *fileName ) 
t 


bool ok = FALSE; 
int w, h; 


if( filename ) 


1 
QApplication :: setÜverrideCursor( waitCursor ); 
ok = image.load( filename , O ); 
pm.convertFromImage( image , conversion flags ); 
if( ok ) 
{ 
setCaption( filename ); 
w = pm.width(); 
h = pm.height(); 
h += menubar->heightForWidth(w) + status->height(); 
} 
else 
{ 
pm.resize( O , O ); 
update О); 
} 
setFixedWidth( w ); 
setFixedHeight( h ); 
status->setGeometry( 0, height() - status->height(), 
width(), status->height() ); 
QApplication :: restoreOverrideCursor () ; 
} 


return ok; 
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J 
void ImageViewer :: paintEvent( QPaintEvent *e ) 
1 
if( pm.size() != QSize( 0, 0 ) ) 
1 
QPainter painter( this ); 
painter.setClipRect( e->rect() ); 
painter.drawPixmap( 0, menubar->heightForWidth( 
width() ), рп); 
} 
} 


Fisierul main.cpp contine instantierea unui obiect QApplication si a 
unuia de tip ImageViewer. 


#include "aplicatie.h" 
#include <qapplication.h> 
#include <qimage.h> 


#ifdef QIMGIO 
#include <qimageio.h> 
#endif 


int main( int argc, char **argv ) 

£ 
QApplication :: setFont( QFont( "Helvetica" , 12 ) D); 
QApplication a( argc, argv ); 


#ifdef QIMGIO 
qInitlImageIO(); 
Желді? 


ImageViewer *w = new ImageViewer( 0, "main window", 
QWidget :: WDestructiveClose ) ; 
w->show() ; 
QObject :: connect( qApp, SIGNAL( lastWindowClosed() ), 
дАрр, SLOT(quit О) ); 
return a.exec() ; 


} 


Lucrarea 3 


Imbunátátirea imaginilor 
prin operatii punctuale 


BREVIAR TEORETIC 


Termenul general de îmbunătăţire a imaginilor se referă la o clasă largă 
de operaţii, ce au ca scop mărirea detectabilitatii componentelor imaginii. 
Această detectabilitate depinde în primul rând de percepţia vizuală а unui 
observator uman şi deci reprezintă o apreciere subiectivă a imaginii. 

Îmbunătăţirea calităţii unei imagini se face fără a presupune vreun model 
de degradare sau a lua în considerare vreo informaţie legată de imaginea 
originală. Paradoxal, dar şi o imagine originală (nedegradată) poate fi 
îmbunătăţită. 

În general, îmbunătăţirea se referă la accentuarea unor caracteristici 
ale imaginii, cum ar fi muchiile, contururile sau contrastul. Procesul de 
îmbunătăţire nu măreşte cantitatea de informatie conținută de o imagine. 


3.1 Operatiile punctuale 


Operatiile punctuale sunt definite de o funcţie, care atribuie un nou nivel 
de gri pixelilor din imagine. Noua valoare a pixelului va depinde doar de 
vechea. valoare a acestuia, de unde şi denumirea de “operaţie punctuală”. 
Matematic se poate scrie: 


glk, l) = $F (k, 0) (3.1) 


unde f este imaginea originală, iar g imaginea îmbunătăţită. g(k,l) 
reprezintă noua valoare a pixelului (k,l), iar f(k,1) vechea valoare. Operatia 
punctuală este descrisă de funcţia ф. 

O operaţie sau o transformare punctuală este reprezentată în Figura 3.1. 


15 


16 LUCRAREA 3. IMBUNATATIREA IMAGINILOR 


f Ø Ë 


-T | ap 


(k17 


Figura 3.1: Reprezentarea unei operații punctuale. 


3.2 Accentuarea contrastului 


Această operație se foloseste in special pentru îmbunătățirea imaginilor cu 
contrast scăzut. Acesta poate apărea datorită unei slabe iluminári, a unei 
iluminări neuniforme sau din cauza unor neliniaritati ale caracteristicilor 
unui senzor de captură a imaginii. O funcţie tipică de accentuare a con- 
trastului are următoarea forma matematică: 


от, pentru x є [0,a) 
Ф()-% B(z—a)+wva, pentru x € (а,Ь) (3.2) 
y(z—b) +u, pentru ze fb, L) 


unde L reprezintă numărul de nivele pe care se face cuantizarea tonurilor 
de gri. Cazul cel mai frecvent este L — 256, pentru o cuantizare pe 8 biti, x 
luând valori in intervalul [0,255]. Valorile а, 8 si y reprezintă pantele celor 
trei segmente de dreaptă. 


Фох! 


V 
b 


Figura 3.2: Functia de accentuare de contrast. 


După cum se observă din Figura 3.2, pantele a gi y sunt pozitive si 
subunitare, iar panta este pozitivă şi supraunitară. Un segment cu pantă 
subunitară realizează o “apropiere” a nivelelor de gri, pe când un segment 
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cu pantă supraunitará va realiza o “depărtare” a nivelelor de gri, şi deci о 
accentuare a contrastului. 


3.3 Intinderea maximă a contrastului 


Aceasta este un caz particular al operatiei de accentuare. Se foloseste, in 
general, pentru reducerea zgomotului dintr-o imagine, atunci cánd se stie 
că acesta ia valori cu precădere în intervalul [a,b]. Forma matematică este 
urmátoarea: 


0, pentru z є [0,a) 
ф(2) = 4 B(r—a) pentru ze [a,b (3.3) 
L-1, pentru x є (b, L) 


Nivelele de gri aflate în intervalul [a,b] vor fi distantate, ca urmare a 
pantei supraunitare, iar nivelele de gri ce se găsesc în afara acestui interval, 
vor fi înlocuite fie cu alb, fie cu negru, după caz. 


pop! 
L-1 


= 


0 a b L-I x 


Figura 3.3: Funcţia de întindere maximă a contrastului. 
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Figura 3.4: Întinderea maximă a contrastului: (a) imaginea originală si (b) 
imaginea rezultată, pentru a—50, b=200. 


3.4  Binarizarea imaginilor 


Binarizarea sau praguirea (“thresholding”) imaginilor este un caz special al 
întinderii maxime a contrastului, pentru care a = b. Rezultatul operaţiei de 
binarizare este o imagine care conţine doar două nivele de gri: alb şi negru. 

Pentru imagini în tonuri de gri, operaţia de binarizare se scrie matematic 
astfel: 


_ J 0, pentru х < Т 
= { L-1, pentru x> T (3.4) 


unde Т este o valoare de prag, reprezentând o valoare întreagă din in- 
tervalul [0, L). 
Pentru imaginile color, binarizarea se poate face in urmátorul mod: 


0, pentru .Y(v)«T 
gp { L-1, pentru Y(v) 2T eo) 
unde v este un vector tridimensional ce reprezinta culoarea pixelului (de 
exemplu v = (R, G, B) ), iar Y (v) reprezintă luminanta (Y = 0.3R+0.6G+ 
0.1B ). 
În urma acestei transformări, contrastul este maximizat la nivelul întregii 
imagini. 
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$a! 
апер 


0 Т L-I x 


Figura 3.5: Funcția de binarizare. 


Figura 3.6: Binarizarea: (a) imaginea originală si (b) imaginea binarizatá 
cu T=127. 

3.5 Месайуагеа imaginilor 

Negativul unei imagini se obține prin inversarea ordinii nivelelor de gri. 


Pentru imaginile în tonuri de gri, operația de negativare se face folosind 
funcţia; 


ф(х) = (L — 1) – = (3.6) 


reprezentată în Figura 3.7, iar pentru imaginile color: 
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pooh 
L-1 


0 L-1 x 


Figura 3.7: Functia de negativare. 


Negativarea imaginilor este utilă pentru afişarea unor imagini medicale 
sau pentru realizarea de imagini negative pe suporturi fizice, de exemplu, 
de tip peliculă. 


Figura 3.8: Negativarea: (a) imaginea originală şi (b) negativul imaginii. 


3.6 Decuparea imaginilor 


Decuparea cu păstrarea fundalului este dată de formula: 


_ Jf L-1, pentru ze [a,b] 
i e { т, іп rest. (3:8) 


iar decuparea fără păstrarea fundalului este dată de formula: 
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(3.9) 


de { L-—1, pentru ze [a,b] 


0, in rest. 


Figura 3.9: Functia de decupare cu pástrarea fundalului. 


A 


PX 


been temen 


Figura 3.10: Functia de decupare fárá pástrarea fundalului. 


Aceste operaţii permit “decuparea” unor regiuni din imagine, caracte- 
rizate de anumite nivele de gri. Acest lucru este folosit atunci când diferite 
carcaterisitici ale imaginii sînt conţinute în nivelele de gri respective, cum 
ar fi de exemplu decuparea regiunilor de temperatură joasă reprezentate 
de nori din imaginile obţinute de un satelit meteo. În astfel de imagini, 
nivelele de gri ce corespund unor nori sînt direct proporţionale cu valorile 
de temperaturi joase. 


DESFĂŞURAREA LUCRĂRII 


Problema 1. Compilati sursele C++ ale lucrării. Rulaţi aplicaţia si 
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observati rezultatul accentuárii contrastului pentru o imagine іп tonuri de 
gri (lena AN.bmp). Funcţia care realizează accentuarea contrastului este 
prezentată în continuare, pentru următoarele valori: a = 80, b = 170, 
V, = 20 gi V, = 235. 

Pantele care caracterizeazá functia de accentuare a contrastului vor fi 


x OS S — 235-20 _ 215. „ — 255—235 _ 20 
următoarele: a = £5 = 0.4, 6 = o w = 50. 81 7 = 555-17) ^ 85: 


int ImageViewer :: f accentuare( int nivel gri ) 
1 
if( nivel gri >= 0 && nivel gri <= 80 ) 
return ( int )( 0.4 * nivel gri ); 


if( nivel gri > 80 && nivel gri <= 170 ) 
return ( int )( 215 / 90. ж ( nivel gri - 80 ) +20); 


if( nivel gri > 170 && nivel gri <= 255 ) 
return ( int )( 20 / 85. ж ( nivel gri - 170 ) + 235 ); 


return nivel gri; 


} 
void ImageViewer :: accentueaza contrastul( void ) 
1 

int w, h; 

int i, j; 

w = image.width(); 

h = image.height(); 


QImage imag_acc( w, h, 32, 0, QImage :: IgnoreEndian ); 


for( i = 0; i < м; i++ ) 
for( j = 0; j < h; j++) 


t 
QRgb pixel = image.pixel( i, |); 
int gri_vechi = qRed( pixel ); 
int gri_nou = f_accentuare( gri_vechi ); 
imag acc.setPixel( i, j, 
qRgb( gri nou, gri nou, gri nou ) ); 
} 


QImageIO iio; 
iio.setImage( imag_acc ); 
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iio.setFileName( "imag_acc.bmp" ); 
iio.setFormat( "BMP" ); 
iio.writeO; 


Problema 2. Modificati valorile a, b, V, si V, ale functiei de accentuare 
a contrastului, si observati rezultatele accentuárii contrastului. 

Problema 3. Implementati operatia de intindere maximá a contrastu- 
lui. 

Problema 4. Implementati operaţia de binarizare. Observati rezul- 
tatele acesteia pentru diferite valori ale pragului Т. 

Problema 5. Observati rezultatul operaţiei de negativare, pentru o 
imagine in tonuri de gri si pentru o imagine color. 


void ImageViewer :: negativeaza imaginea( void ) 
1 

int w, h; 

int i, j; 


w = image.width(); 
h = image.height(); 


QImage imag neg( ы, h, 32, 0, QImage :: IgnoreEndian ); 


for( i = 0; i < w; itt) 

for( j = 0; j < h; j++ D 

1 
QRgb pixel = image.pixel( i, j ); 
int r - qRed( pixel ); 
int g = qGreen( pixel ); 
int b - qBlue( pixel ); 
imag neg.setPixel( i, j, qRgb(255-r, 255-g, 255-b) ); 


QImagelO0 iio; 

iio.setImage( imag neg ); 
iio.setFileName( "imag neg.bmp" ); 
iio.setFormat( "BMP" ); 
iio.write(); 


Problema 6. Implementati cele două operaţii de decupare. 
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Lucrarea 4 


Imbunatatirea imaginilor 
prin egalizarea histogramei 


BREVIAR TEORETIC 


Tehnicile de îmbunătăţire a imaginilor bazate pe calculul histogramei modifi- 
cá histograma astfel încât aceasta să aibă o anumită forma dorită. 


4.1 Histograma unei imagini 


Histograma unei imagini reprezintă, frecvenţa relativă. de apariţie a nivelelor 
de gri din imagine. Pentru o imagine f, de dimensiune M x N pixeli, 
histograma se defineşte astfel: 


1 M-1N-1 
hes 2. 2, ôli, f(m,n)) , i=0,.,L—1 (4.1) 


unde functia ó este definitá in urmátorul mod: 


_ J 1, dac ж=у, 
S { 0, dacă ху. (4:2) 


Din punct de vedere statistic, putem considera valoarea fiecárui pixel al 
imaginii ca o realizare particulará a unei variabile aleatoare asociatá nivelelor 
de gri, caz in care histograma reprezintá functia de densitate de probabilitate 
a acestei variabile aleatoare. Fiind o functie de densitate de probabilitate, 
histograma oricárei imagini verificá conditia de normare: 


L—1 
УА) =1 (4.3) 
i—0 


Practic, calculul histogramei presupune parcurgerea pixel cu pixel a 
imaginii şi contorizarea numărului de nivele de gri întâlnite. 
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4.2  Egalizarea histogramei 


Egalizarea histogramei reprezintă o operaţie de accentuare a contrastului si 
are ca scop obţinerea unei histograme uniforme. 

Vom asocia unui pixel din imagine o variabilă aleatoare £. Astfel, va- 
lorile intensității luminoase ale pixelilor reprezintă. realizări particulare ale 
variabilei aleatoare asociate. Vom considera că variabila aleatoare £ are o 
densitate de probabilitate we() şi o funcţie de repartiție Fe(x) = P(£ < xj. 

Vom defini în continuare variabila 7, care are funcţia de repartiție: 


x 


E J pe(t)dt 
0 


şi care va fi uniform distribuită în intervalul (0, 1). 

Pentru cazul discret, presupunem ca nivelele z de gri ale pixelilor au va- 
lori intre 0 si L—1 (unde L este de regula 256), avánd asociate probabilitatile 
de apariţie pe(r;), unde x; = 0,1,..,L — 1. Aceste probabilitati pot fi 
estimate pe baza calculului histogramei, consideránd imaginea datá, ca fiind 
o realizare particulará a procesului aleator descris de variabila aleatoare £, 
astfel: 


Noile nivele de gri, reprezentând valori discrete ale variabilei 7 din inter- 
valul [0, L — 1] se vor calcula cu formulele: 


һа) = бе) 
z¿=0 


he [nivelyecn;] = 

lc hemin 

unde he reprezintă histograma cumulativ a imaginii, iar hemin este va- 
loarea minimă a histogramei cumulative. 


piron 
nivelnou = int | emm (EL — 1) + 0.5 


4.2.1 Algoritmul de egalizare a histogramei 


Algoritmul de egalizare de histogramă, folosit în practică, poate fi descris în 
limbaj pseudocod astfel: 
Pasul 1. Se calculează histograma imaginii: 
pentru i = 1,..,L 
hi] = 0 
pentru i = 1,..,M 
pentru j = 1,..,N 
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nivel = imagine[i,j] 

h[nivel] = h[nivel] + 1 
unde L este numárul de nivele de gri (256), h este histograma imaginii, iar 
M si N sunt dimensiunile imaginii. 


Pasul 2. Se calculeazá histograma cumulativá a imaginii: 
Һе = hi1] 
pentru i = 2,..,L 
Һе = he[i-1] + hfi] 


Pasul 3. Se calculează noile nivele de gri din imagine, sub forma unei 
transformări y = T'(z) dată de formula: 


astfel: 
pentru i = 1,..,M 
pentru j = 1,..,N 
nivel_vechi = imagine[i,;j] 
nivel. nou = T(nivel_vechi) 
imagine{i,j] = nivel_nou 


4.3 Observații 


e Deşi la prima vedere egalizarea de histogramă ar părea că este o 
operaţie punctuală, din cauza formulei de calcul a noilor valori de 
gri, ea este totuşi o operaţie integrală, datorită faptului că pentru 
fiecare pixel din imagine noua valoare se calculează pe baza calculului 
histogramei şi, deci, pe baza valorilor tuturor pixelilor din imagine. 


e În Figura 4.1 puteţi observa cum imaginea a fost îmbunătăţită prin 
egalizarea. histogramei. 


e In Figura 4.2 puteţi observa cum s-a modificat forma histogramei ima- 
ginii originale, după egalizare. 
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Figura 4.1: Egalizarea histogramei: (a) imaginea originalá si (b) imaginea 
rezultată. 


Аі, 


Figura 4.2: Histograma (a) originală si (b) după egalizare. 
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O posibilă implementare a algoritmului de egalizare a histogramei este prezen- 
tat în continuare: 


void ImageViewer :: egalizeaza histograma( void ) 
i 

int i, j; 

int width, height; 

int h[ 256 ]; 


for( i = 0; i < 256; i++ ) 
h[ i ] = O; 


width = image.width() ; 
height = image.height(); 


//calcularea histogramei imaginii 
for( i = 0; i < width; i++ ) 
for( j = 0; j < height; j++ ) 
1 
QRgb pixel; 
pixel = image.pixel( i, 3); 


int nivel gri - qRed( pixel ); 
h[ nivel gri ]++ ; 


//calcularea histogramei cumulative 
double hc[ 256 ]; 


hc[ 0 ] = h[ O ]; 
for( i = 1; i < 256; i++ ) 
hc[ i] =hc[ i - 1] + h[ і]; 


QImage imag eq( width, height, 32, 0, QImage::IgnoreEndian ); 


//egalizarea histogramei 
for( i = 0; i < width; i++ ) 
for( j = 0; j < height; j++ ) 
t 
QRgb pixel = image.pixel( i, j ); 


int nivel - qRed( pixel ); 


30 LUCRAREA 4. EGALIZAREA HISTOGRAMEI 


int nivel nou = (int)( ( hc[nivel] - hc[0] ) * 255 / 
( width*height - hc[0] ) ); 


imag eq.setPixel( i, j, 
qRgb( nivel nou, nivel nou, nivel nou ) ); 


image - imag eq; 
pm = image; 
update() ; 


Problema 1. Observati forma histogramei pentru cáteva imagini in 
tonuri de gri. 

Problema 2. Observati efectele egalizarii de histograma pentru diferite 
imagini, inclusiv pentru o imagine subexpusa si pentru una supraexpusa. 

Problema 3. Modificati functia histograma_imaginii astfel incat 
aceasta sà calculeze histograma cumulativa a imaginii. Observati forma 
unei histograme cumulative. 

Problema 4. Justificati faptul cà histograma cumulativa a unei imagini 
poate fi considerata estimatul unei functii de repartitie. 


Lucrarea 5 


Transformări geometrice de 
bază 


BREVIAR TEORETIC 


Transformările geometrice sunt transformări care nu modifică valorile pi- 
xelilor din imagine, ci modifică doar aşezarea, lor spaţială. Cu alte cuvinte, 
lasă. nemodificata compoziţia imaginii, alterându-i însă structura. În urma 
aplicării unei transformări geometrice asupra unei imagini, histograma aces- 
tela nu se modifică. 


5.1 Translatia 


Translatia se defineşte ca fiind operaţia de modificare în linie dreaptă a 
coordonatelor unui pixel din imagine de la o poziţie la alta. Un pixel de 
coordonate carteziene (x,y) va avea după translație coordonatele (z , ), 
astfel: 


т = z+ Т, 
, 5.1 
I y =у+Т, (m 


unde perechea (Ту, Т.) reprezintă vectorul de translație (vezi Figura 5.1). 

Translatarea unei imagini se realizează prin translatarea fiecărui pixel 
in parte. Valorile T; si Ty sunt numere întregi pozitive sau negative. În 
cazul în care noile coordonate ale unui pixel depăşesc dimensiunile imaginii, 
atunci el va fi poziționat în partea opusá a imaginii, ca in Figura 5.2. 


5.2 Rotatia 


Rotatia se defineşte ca fiind operaţia de modificare după o traiectorie cir- 
culară a coordonatelor unui pixel din imagine (vezi Figura 5.3). Rotatia 
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д 
- 


(0,0) x 


Figura 5.1: Translatarea unui obiect dreptunghiular. 


Figura 5.2: Translatarea spre dreapta a unui obiect dreptunghiular într-o 
imagine. 


este specificată, de unghiul g. Poziţia unui pixel, exprimată în coordonate 
carteziene (2, у), se exprimă în coordonate polare (r, 0) astfel: 


(5.2) 


Noile coordonate carteziene (x’, y') ale pixelului rotit cu un unghi ф vor 
fi: 


(5.3) 


a! = rcos(0 + 9) = rcos0cosQ — твіпбвіпф = тсовф- ysinó 
y -—rsin(0 + 0) = rsin0cosQ + rcos0sinó = xsin + усовф 
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(х,у) 


(х,у) 


Figura 5.3: Rotatia. 


5.3 Oglindirea 


Oglindirea este operaţia prin care se produce imaginea în oglindă a unui 
obiect, relativ la o axă de oglindire. In Figura 5.4 sunt ilustrate cele două 
feluri de oglindire: oglindirea “stânga-dreapta” şi cea “sus-jos”. 


Figura 5.4: Oglindirea (a) “stânga-dreapta” (b) “sus-jos”. 


Observaţii în Figura 5.5 efectele oglindirii “stânga-dreapta” a imaginii 
Lena, faţă de o axă verticală ce trece prin centrul imaginii. 
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Figura 5.5: Oglindirea “stânga-dreapta”: (a) imaginea originală; (b) imag- 
inea oglindita. 


DESFÁSURAREA LUCRÁRII 


Іп continuare este prezentat codul C care implementează translatia unei 
imagini pe orizontală, cu un deplasament de 100 de pixeli. Citiţi şi intelegeti 
codul. 


void ImageViewer :: translateaza imaginea( void ) 
1 

int w, h; 

int i, j; 


int iprim, tx - 100; 


м = image.width(); 
h = image.height(); 


QImage imag tx( w, h, 32, 0, QImage :: IgnoreEndian ); 


for( i = 0; i < м; itt) 
for( j = 0; j < h; j++ D 
1 
QRgb pixel = image.pixel( i, |); 


iprim = i + tx; 
if( iprim >= w ) 
iprim -- w; 
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imag_tx.setPixel( iprim, j, pixel ); 


image = imag_tx; 
pm = image; 
update(); 


Problema 1. Implementati operatia de translatie, pentru urmátorii doi 
vectori de translatie: (0,100) si (100,100). 

Problema 2. Implementati operaţia de oglindire “stânga-dreapta” fata 
de axa verticalá ce trece prin centrul imaginii. 

Problema 3. Implementati operaţia de oglindire “sus-jos” faţă de аха 
orizontală, ce trece prin centrul imaginii. 
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Lucrarea 6 


Zgomotul in imagini 


BREVIAR TEORETIC 


Zgomotul este un semnal aleator, care afectează informaţia utilă conținută, 
într-o imagine. El poate apare de-alungul unui lanţ de transmisiune, sau 
prin codarea şi decodarea imaginii, şi reprezintă un element perturbator ne- 
dorit. De obicei se încearcă eliminarea lui prin diverse metode de filtrare. 


Zgomotul se poate suprapune informaţiei utile în două moduri: 


e aditiv. În acest caz, zgomotul se numeşte zgomot aditiv şi matematic 
se poate scrie: 
g(x,y) = f(x,y) + n(z. y) (6.1) 


unde f(x, y) este imaginea iniţială, neafectatá de zgomot, n(x, y) este 
zgomotul, iar g(x,y) este imaginea afectată de zgomot. 


e multiplicativ. În acest caz zgomotul se numeşte zgomot multiplicativ, 
iar fenomenul de suprapunere al acestuia peste informaţia utilă, se scrie 
matematic astfel: 
unde f(x,y), n(z, y) si g(x,y) au aceleaşi semnificaţii ca mai sus. 

În continuare vom trata zgomotul ca fiind aditiv. Modelul de degradare 


a imaginii este reprezentat în figura 6.1. Zgomotul multiplicativ poate fi 
tratat la fel de simplu ca zgomotul aditiv, dacă logaritmăm relaţia (6.2): 


log(g(x,y)) = log( f(x,y) - n(x, y)) = log(f(z,u)) + log(n(z,y)) (6.3) 


Cantitativ, se poate aprecia măsura în care zgomotul a afectat informaţia. 
utilă, calculând raportul semnal-zgomot!: 


!SNR = (engl) Signal Noise Ratio. 
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n(x,y) 


f(x,y) g(x,y) 


Figura 6.1: Modelul aditiv de degradare. 


M-— 
Dy 
i=0 j= 
M-1N 

> 2, (i, 9) 


i=0 j=0 


1N-1 
> Pii) 
SNR = 10log 2 [dB] (6.4) 


SNR = 10104- [dB] (6.5) 


—1 


P: 10.7) — 9063) 


i=0 j-0 


Raportul semnal-zgomot reprezintă raportul dintre energia imaginii ori- 
ginale şi energia zgomotului suprapus acesteia. În continuare vom asocia 
valorilor pe care le ia zgomotul o variabilă aleatoare £, care, în funcţie de 
tipul zgomotului, va fi caracterizată de diferite funcţii de densitate de prob- 
abilitate. 


6.1 Zgomotul cu distribuţie uniformă 


Zgomotul cu distribuţie uniformă (vezi Figura 6.2) este caracterizat de o 
funcţie de densitate de probabilitate de forma: 


_ J A, pentruz€ [-5; š] ; 
з { 0, înrest. (6.6) 


Іш Figura 6.3 puteti observa efectele zgomotului cu distributie uniformá 
asupra imaginii *Lena", pentru un raport semnal/zgomot de 5 dB. 
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À 
w(x) 
A 
-k/2 0 k/2 x 


Figura 6.2: Functia de densitate de probabilitate pentru o distributie uni- 
formá. 


Figura 6.3: Zgomotul uniform: (a) imaginea originală; (b) imaginea afectată 
de zgomot uniform, SNR=5 dB. 


6.2 Zgomotul cu distribuţie gaussiană 


Zgomotul gaussian este caracterizat de o funcţie de densitate de probabili- 
tate de forma (vezi Figura 6.4): 


wels) = e 202 (6.7) 
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-60 -48 -36 -24 -12 00 12 24 36 48 60 
0.3 0.3 


w(x) 
° 
io 


pert — 0.0 
60 -48 -3.6 -24 -12 00 12 24 36 48 60 
x 


0.0 


Figura 6.4: Functia de densitate de probabilitate pentru o distributie gaus- 
siana. 


Valoarea medie a unei variabilei aleatoare £, cu o distributie data de 
funcţia zk (z) ca in relaţia (6.7), este и, iar varianta ei este a°. O distribuţie 
gaussianá se mai numeşte şi normală. O distribuţie normală de medie p si 
variantá o? se notează cu N (u, o?). 


În Figura 6.5 puteţi observa efectele zgomotului cu distribuţie gaussianá 
asupra imaginii “Lena”, pentru un raport semnal/zgomot de 5 dB. 


Figura 6.5: Zgomotul Gaussian: (a) imaginea originală; (b) imaginea afec- 
tata de zgomot gaussian, SNR=5 АВ. 
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6.3 Zgomotul de tip “sare şi piper” 


După cum îi spune numele, acest tip de zgomot va afecta valorile pixelilor 
în două moduri: “sare” - adică noua valoare a pixelului va fi 255 (pixelul 
va fi alb), sau “piper” - adică noua valoare a pixelului va fi 0 (pixelul va 
fi negru). Zgomotul de tip “sare şi piper” (vezi Figura 6.6) este perfect 
decorelat, deoarece între valorile 0 şi 255, şi între coordonatele pixelilor 
afectaţi de zgomot nu există corelaţie. 


(b) 


Figura 6.6: Zgomotul "sare gi piper": (a) imaginea originalá; (b) imaginea 
cu 1096 pixeli afectati de zgomot. 


6.4 Alte tipuri de zgomot 
Zgomotele diferă între ele in funcţie de distributia care le caracterizează. 
Alte funcţii de distribuţie utilizate sunt: 


22 


e distributia Rayleigh: we(x) = хе 2 

e distributia Maxwell: we(x) = een 

e distributia Beta: we(x) = zb(1 — z)° 

e distributia Gamma (Erlang): we(r) = ze 
e distributia Laplace: w(x) = егізі 

e distributia Cauchy: te (z) = тт 


Aceste functii sunt reprezentate in Figura 6.7. 
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Rayleigh Maxwell 


05 10 15 20 25 30 35 40 45 50 15 20 25 30 35 40 45 50 
07 0з 
eo 


05 10 15 20 25 30 35 40 45 50 15 20 25 30 35 40 45 50 


Beta Gamma 


03 04 05 06 07 08 09 10 10 20 30 40 50 60 70 80 90 100 
02 04 
— ——————| 


X 


` 
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Laplace Cauchy 


48 36 24 -12 00 12 24 36 48 60 -100 80 -60 -40 20 00 20 40 60 
a a a rrr ттт T a 11 TT ттт SEE SS дак э i 


ES 


к = = = 
48 36 24 12 00 12 24 36 48 60 -10.0 -80 -60 -40 20 00 20 40 60 80 100 


Figura 6.7: Diverse functii de distributie. 


DESFASURAREA LUCRARII 


Problema 1. Suprapuneti zgomot cu distributie uniforma peste o imagine 
in tonuri de gri (in meniul Algoritmi, functia zgomot uniform). 


6.4. ALTE TIPURI DE ZGOMOT 


void ImageViewer :: zgomot_uniform( void ) 
t 


int i, j; 


int w = image.width(); 
int h = image.height(); 


long int e_zgomot = 0; //energia zgomotului 
long int e_imagine = 0; //energia imaginii 


double SNR; //raportul semnal-zgomot 


//imaginea afectata de zgomot 
QImage image aff( w, h, 32, 0, QImage::IgnoreEndian ); 


int med = 0; //media zgomotului 
int dis = 200; //dispersia zgomotului 


for( i = 0; i < w; itt) 
for( j = 0; j < h; j++ D 
1 
QRgb pixel = image.pixel( i, j ); 
int nivel gri - qRed( pixel ); 


e imagine += nivel gri * nivel gri; 


//srand( rand() ); 
int zgomot = ( int )( med + sqrt( 3 )* 
(2. ж ( гапа() /( RAND. MAX + 1. )))*sqrt(dis) ); 
e zgomot += zgomot * zgomot; 
int val = nivel gri + zgomot; 


if( val » 255 ) 


val = 255; 
if( val < 0) 
val = 0; 


image_aff.setPixel( i, j, qRgb( val, val, val )); 


SNR = 10 * log( 1. * e imagine / e zgomot ); 


image - image. aff; 
pm = image; 
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update(); 


QString mesaj; 
mesaj.sprintf( "SNR = 7%6.31f dB", SNR ); 
QMessageBox::about( this, "SNR", mesaj ); 


Problema 2. Modificati media si dispersia zgomotului cu distributie 
uniformă (în fişierul algoritmi.cpp, funcţia genereazà.zgomot uniform). 
Observati efectele. 

Problema 3. Suprapuneti zgomot cu distribuţie gaussiană peste o 
imagine în tonuri de gri (în meniul Algoritmi, funcţia zgomot gaussian). 
Diferenţa. între această funcţie şi cea, care generează constă în modul în care 
este calculată valoarea zgomotului, şi anume: 


int zgomot = ( int )( med + sqrt( 2 ) * 
sqrt( -1.* log( rand()/( RAND MAX + 1. ))) ж 
cos( 2 ж 3.1415926 ж ( rand O/( RAND _МАХ+1 ))) ж 
sqrt( dis ) ); 


Problema 4. Modificati media si dispersia zgomotului cu distributie 
gaussiană (fişierul algoritmi.cpp, funcţia generează zgomot gaussian). 
Observati efectele. 

Problema 5. Suprapuneti zgomot de tip “sare şi piper" peste o imagine 
în tonuri de gri (în meniul Algoritmi, funcţia zgomot.salt and pepper). 
Codul acesteia este prezentat, în continuare: 


void ImageViewer :: salt and pepper( void ) 
1 

int i, 1, K; 

int w = image.width(); 

int h = image.heightO; 


double nr - 0.1; //procentul de pixeli afectati de zgomot 


srand( rand() ); 


k = 0; 

while( k < ( int )( w * h жас) ) 

í 
i = ( int )( 1. * w ж rand() / ( RAND MAX + 1. ) ); 
j = ( int )( 1. * h ж randO / (RAND MAX + 1. ) ); 


QRgb sare_piper; 
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if( ( 100. * rand() / ( RAND MAX + 1. ) ) >= 50 ) 
sare piper - qRgb( 255, 255, 255 ); 

else 
sare piper = qRgb( 0, 0, 0); 


if( (i >= 0) && Gi < w) && (j >= 0) && (j < h) ) 
image.setPixel( i, j, sare_piper ); 


k++; 


5 


pm = image; 
update() ; 


Problema 6. Modificati procentul de pixeli afectati de zgomot de tip 
“sare şi piper" (fişierul algoritmi.cpp, funcţia zgomot ѕа1+ ара pepper). 
Observati efectele. 
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Lucrarea 7 


Filtrarea imaginilor 


BREVIAR TEORETIC 


Filtrarea imaginilor se înscrie în clasa operaţiilor de îmbunătăţire, princi- 
palul scop al acesteia, fiind eliminarea, zgomotului suprapus unei imagini. 

Filtrarea reprezintă. o operaţie de vecinătate. Prin aceasta se înţelege că 
la calculul noii valori a unui pixel vor contribui şi valorile pixelilor vecini, nu 
doar vechea, lui valoare, cum se întâmpla la operaţiile punctuale. Vecinii 
unui pixel reprezintă o mulţime de pixeli, aflaţi în apropierea acestuia, 
care alcătuiesc o vecinătate. Această vecinătate poate avea diverse forme 
şi dimensiuni, însă cele mai utilizate în practică sînt vecinatatile de forma 
pătrată, de dimensiuni impare. 


7.1 Filtrarea liniară a imaginilor 


După cum îi spune numele, acest tip de filtrare respectă principiul liniaritatii 
(sau al superpozitiei). 

Principiul liniaritátii: Fiind date două imagini ју (2, y) si fo(x, y), si două 
numere reale a şi 3, se numeşte operator liniar, un operator O care аге 
următoarea, proprietate: 


O [o ` fi(z,y) T ` Jo (z, v)] =a: О[А (2, y)] T B ` O|fə(z,1)] (7.1) 


Operatia de filtrare liniară calculează noua valoare а unui pixel al ima- 
ginii, din poziţia (m,n), ca o combinaţie liniară a unui număr de valori din 
imaginea originală, astfel: 


g(m,n) = Y uu: fim = kn- 1) (7.2) 


(КЫ) EW 


unde f(x, y) este imaginea originală (afectată sau nu, de zgomot), g(x, y) 
este imaginea filtratá, W este o structurá de puncte care defineste vecinátatea 
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pixelului (m, n), wj, sint nişte valori constante care reprezintă coeficienţii 
filtrului. 

Filtrul este definit de vecinătatea. W şi de coeficienţii wj. Un filtru poate 
fi specificat de o matrice V, care poartă numele de mască de convolutie 
sau mască de filtrare, care este caracterizată de formă, valorile coeficienţilor 
şi de origine. În Figura 7.1 este prezentată o mască de filtrare de formă 
pătrată, de dimensiune 3x3, având originea în centru. 


Figura 7.1: Mască de filtrare pătrată de dimensiune 3x3. 


Nu este obligatoriu ca forma mástii de filtrare să fie pătrată, de dimen- 
siune impară sau să aibă originea în centrul mastii. 

Operația de filtrare liniară poate fi descrisă, astfel: se suprapune masca de 
filtrare peste fiecare pixel al imaginii originale, astfel încât originea măştii 
să coincidă cu pixelul considerat, apoi se calculează toate produsele între 
coeficienţii mastii şi valorile pixelilor peste care se suprapun aceşti coeficienţi, 
iar suma acestor produse reprezintă noua valoare a pixelului considerat. 
Această tehnică poartă numele de tehnica ferestrei glisante. Operația 
descrisă, reprezintă de fapt o convolutie bidimensională. 


7.11  Filtrele de netezire 


Filtrele de netezire sunt echivalentele bidimensionale ale filtrelor trece-jos 
(FTJ), si la fel ca acestea, sint folosite in general pentru eliminarea zgomo- 
tului, care se presupune că este de bandă largă. 

Informaţia conținută, într-o imagine, în general, se regăseşte în compo- 
nentele de joasă frecvenţă, şi deci este justificată o filtrare trece-jos pentru 
reducerea, puterii zgomotului. 

Zgomotul din imagine se presupune că este aditiv şi pur aleator, adică 
se consideră următoarele ipoteze simplificatoare: 


e g(i, j) = f, j) + n(¿, j) (zgomotul n este aditiv), 


e n este un semnal staționar (comportamentul său statistic nu depinde 
de coordonatele i şi j ale pixelului), 
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e 7i — 0 (media zgomotului este zero), 


e dacă zgomotul are dispersia on, atunci: 


RECOGE CR ORY O, pentru 11 = 22 & Ji = J2 
n(ii, 1) : n(i2, j2) = { 0 în rest 


(zgomotul este complet decorelat). 


Conditia de normare a coeficientilor filtrelor de netezire 


Pentru un filtru trece-jos se impune urmátoarea conditie: componenta con- 
tinuá a imaginii sa nu fie alterată de filtru. Cu alte cuvinte, filtrul să conserve 
luminozitatea medie a imaginii. 

Pentru aceasta, considerăm o imagine având un singur nivel de gri, con- 
stant, notat cu и, adică: f(i,j) = и pentru oricare i si j. Pentru ca filtrul să 
conserve luminozitatea medie, adică valoarea medie и, impunem g(i, j) = и 
pentru Vi, j. Rezultă: 


ES S h (7.3) 


(k,l) eW 


SUCCES (7.4) 


(k,l) EW 


unde wy; > 0. 
Relatia (7.4) poarta numele de conditie de normare pentru filtre de 
netezire (sau trece-jos). 


Filtrul de mediere 


Filtrul de mediere este cel mai simplu filtru de netezire. Caracteristic unui 
filtru de mediere este faptul ca toti coeficientii mastii de filtare sint egali. 
Daca tinem cont si de conditia de normare, atunci coeficientii unui filtru 
de mediere, care are o masca de filtrare de dimensiune N x N, au valoarea 
NT În Figurile 7.2, 7.3 si 7.4 sunt prezentate măştile de filtrare de mediere, 
pentru N = 3, 5 şi respectiv 7. 


Figura 7.2: Mască de filtrare pătrată de dimensiune 3 x 3. 
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Figura 7.4: Mascá de filtrare pátratá de dimensiune 7 x 7. 


Figura 7.5: Filtrarea de mediere: (а) imaginea originală; (b) imaginea fil- 
tratá cu o mascá 7xT. 


Filtrul de mediere nu este folosit în practică, deoarece, pe lângă zgo- 
mot, are de suferit si semnalul util (vezi Figura 7.5). Filtrarea de me- 
diere este deranjantă pentru imagine în acele zone în care imaginea conţine 
frecvenţe înalte (variaţii bruste), pentru cá duce la apariţia fenomenului de 


înceţoşarel. 


1(engl.) blurring. 
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Din punctul de vedere al zgomotului, pentru filtrare este utilá o mascá 
de filtrare de dimensiune cát mai mare. Din punctul de vedere al semnalului 
util, al imaginii, este util ca masca sá Не cát mai micá. In practicá se 
realizeazà un compromis intre cele douá aspecte. 


Alte măşti de filtrare 


Alte măşti de filtrare, pentru filterele de mediere, sunt prezentate în contin- 
uare, deşi toate au acelaşi randament nesatisfăcător. 


1. „2 1 1 1 1 1 1 
i6 16 16 i6 16 16 0 g 0 0g 0 
DEN EE Ho o eT: 1 1 1 1 1 1 
16 16 16 16 2 16 5 5 5 8 4 8 
Lo 2 1 1 1 1 1 1 
16 16 16 16:16 16 050 0 3 0 


7.1.2  Filtrele trece-sus 


Filtrele trece-sus urmăresc eliminarea componentelor de frecvenţă joasă din 
imagine. Sunt folosite în general pentru detectarea frontierelor sau contu- 
rurilor din imagine, acolo unde au loc treceri sau variaţii bruste ale luminantei. 


Condiţia de normare a coeficienţilor filtrelor trece-sus 


Condiţia de normare a coeficienţilor pentru un filtru trece-jos (relaţia (7.6)) 
se determină impunând condiţia ca filtrul să rejecteze complet (sau să atenueze 
complet) componenta continuă a imaginii. 

Pentru aceasta vom considera, la fel, o imagine f(¿, j) = и pentru Vi, j. 
La ieşirea filtrului trece-sus vom avea g(i, j) = 0 pentru Vi, j. 


0= Ушы и (7.5) 


(k,l) EW 


> Sowa = 0 (7.6) 


(k,l) EW 


Filtrul de accentuare 


Filtrul de accentuare nu este un filtru trece-sus, ci foloseste filtrarea trece- 
sus pentru a realiza accentuarea. Prin accentuare se intelege contrastarea 
unei imagini si are ca scop imbunatatirea perceperii vizuale a contururilor 
obiectelor. Cu alte cuvinte, îmbunătăţirea, detectabilitatii componentelor 
scenei de-a lungul frontierelor acestora. Acest lucru se realizează, în prin- 
cipiu, prin modificarea. valorilor pixelilor situaţi de o parte şi de alta a unei 
frontiere comune. 
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Sistemul uman are tendinţa de a adânci profilul zonelor de tranziţie 
dintre regiuni uniforme. Studiul fiziologiei sistemului vizual a demonstrat 
cà aceasta se realizează prin prelucrări de tip derivativ ce apar în diferitele 
etape pe care le parcurge informaţia vizuală. Efectul global poate fi mo- 
delat matematic prin scăderea, din semnalul original a unei derivate secunde 
ponderate. 

În continuare sunt prezentate câteva măşti de implementare a unei derivate 
secunde de tip Laplace: 


1 1 i, JU 1 1 1 

0 — O L -i 4 -i -4 -i 
1 1 1 1 1 1 
ido cfs 42 -l 1 -i — 1 -i 
1 1 1 1 1 1 1 

о —1 p L -i 4 -i -i-i 


Figura 7.6: Filtrarea Laplace: (a) imaginea originală; (b) imaginea rezultată 
(negativatá). 


Filtrul de accentuare se implementează după schema prezentată in Figura 
7.7. 


7.2 Filtrarea neliniará a imaginilor 


Filtrele neliniare nu respecta principiul liniaritatii sau al superpozitiei enun- 
tat la inceputul lucrárii. Acestea au apárut din necesitatea de a depási 
limitarile filtrelor liniare, in ceea ce priveste zgomotele care nu au o distributie 
normalá sau nu sunt aditive. 
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қа.) 


LAPLACIAN 


Figura 7.7: Filtrul de accentuare. 


7.2.1 Filtrele de ordine 


Filtrele de ordine sunt operatori locali, definiti la rândul lor de o fereastră, 
care selectează din imagine un număr de pixeli vecini pixelului curent, intr- 
un mod identic cu tehnica ferestrei glisante. Valorile pixelilor selectaţi se 
ordonează, crescător. 

Să presupunem că fereastra conţine n pixeli, iar valorile lor formează 
următoarea mulţime: 


Таңы te ee (7.7) 


Dupa ce aceste valori au fost ordonate crescátor, vom avea: 


іт(1),2(ә)-- Z(n) J (7.8) 


pentru care sunt îndeplinite următoarele condiţii: 


Ieşirea filtrului de ordine de ordin k, pentru k € [1;n] întreg, este sta- 
tistica de ordinul k, cu alte cuvinte, elementul de pe pozitia k din sirul 
ordonat: 


ranky(z1, £2, ..., En} = Z(k) (7.10) 


Filtrul median 


Filtrul median ete un filtru de ordine a cárui iegire este statistica de ordin 
central, adică elementul ce se află pe poziţia de mijloc a şirului ordonat de 
valori selectate de fereastra de filtrare: 


| Таза) ааса n este impar, 
median{ z1, £2, .., En} =$ 1 2 (7.11) 
Dl T(n) daca п este par. 
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Filtrul median este potrivit pentru eliminarea zgomotului de tip “sare 
si piper". Dupá ordonarea valorilor pixelilor, valorile zgomotului (adicá 0 
sau 255) se vor situa pe primele, respectiv ultimele pozitii in multime, si 
deci, la ieşirea filtrului, vom avea o valoare diferită de valorile zgomotului. 
Totuşi există şi situaţii în care, după filtrare, mai există pixeli afectaţi de 
zgomot. În acest caz, spunem că filtrul a fost “străpuns” de zgomot. Acest 
lucru este posibil atunci când mai mult de jumătate din pixelii selectatti de 
fereastra. de filtrare, sunt afectaţi în acelaşi mod (sare sau piper, 255 sau 0) 
de zgomot. 


Figura 7.8: Filtrul median: (a) imaginea originală afectată de zgomot “sare 
şi piper”; (b) imaginea filtrată. 
Filtrul de minim 


Filtrul de minim este un filtru de ordine a cărui ieşire este statistica de 
ordinul 1, adică valoarea х), care este cea mai mică valoare din mulţimea 
de valori ale pixelilor selectaţi de către fereastra de filtrare. 


Filtrul de maxim 


Filtrul de maxim este un filtru de ordine a cărui ieşire este statistica de 
ordinul n, adică valoarea x(,), care este cea mai mare valoare din mulţimea 
de valori luate în considerate. 


DESFĂŞURAREA LUCRĂRII 


Problema 1. Observaţi efectele filtrului de mediere pentru o imagine afec- 
tata de zgomot gaussian. Codul C al funcţiei care implementează filtrul de 
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mediere este prezentat in continuare: 


void ImageViewer :: filtru mediere( void ) 
t 

int 1, 3; 

int k, 1; 

int w, h; 


double v[ 3 ][ 3 ]; 


//coeficientii mastii de filtrare 

v[0][0] = 1./9; v[0][1] = 1./9; v[0][2] = 1./9; 
v[1] [0] = 1./9; v[11[1] 1./9; v[11[2] = 1./9; 
v [21 [0] 1./9; v[21[1] 1./9; v[21[2] 1./9; 


w = image.width(); 
h = image.height(); 


QImage image_fil( w, h, 32, 0, QImage::IgnoreEndian ); 


for( i = 1; i < wç - 1; i++) 
for( j = 1; j <h - 1; j++) 
í 
//suma ponderata 
double sum = 0; 
for( k = -1; k < 2; k++ ) 
for( 1 = -1; 1 < 2; l++ ) 
sum += v[ k +1][ 1 + 1 ] * 
qRed( image.pixel( i + k, j + 1 )); 
image fil.setPixel( i, j, 
qRgb( (int)sum, (int)sum, (int)sum )); 
} 


image = image_fil; 
pm = image; 
update(); 


Problema 2. Observati efectele filtrului de mediere pentru o imagine 
afectatá de zgomot de tip "sare gi piper". 

Problema 3. Observati efectul de “blurring” al filtrului de mediere 
pentru o imagine neafectatà de zgomot. 
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Problema 4. Implementati un filtru de mediere cu o mască de filtrare 
de formă pătrată de dimensiune 5x5. 

Problema 5. Observati efectul filtrului de accentuare (pentru o imagine 
neafactată de zgomot). Codul C al filtrului este următorul: 


void ImageViewer :: filtru accentuare( void ) 
1 

int i, j; 

int k, 1; 

int w, h; 


double sum; 
double v[ 3 ][ 3 ]; 


//coeficientii mastii 


v[0] [0] = o; v[0] [1] = -1./4; v[0] [2] = 0; 
v[1] [0] = -1./4; v[1] [1] = 1; v[1] [2] = -1./4; 
v [2] [0] = 0; v[2] [1] = -1./4; v[2] [2] = 0; 

w = image.width(); 


h = image.height(); 
QImage image fil( w, h, 32, 0, QImage::IgnoreEndian ); 


for( i = 1; i < wç - 1; i++) 
for( j = 1; j «h- 1; j+) 


í 

sum = 0; 

for( k = -1; k < 2; k++ ) 

for( 1 = -1; 1 < 2; l++ ) 
sum += 1. *v[ k * 1 ][ 1 + 1] * 
qRed( image.pixel( і + k, j + 1 )); 

int niv = qRed( image.pixel( i, j )); 

niv = (int)( niv + 0.6 * sum ); 

image fil.setPixel( i, j, qRgb( niv, niv, niv )); 
} 


image = image_fil; 
pm = image; 
update(); 


72. FILTRAREA NELINIARÀ A IMAGINILOR 57 


Problema 6. Observati efectele filtrului median pentru o imagine afec- 
tata de zgomot de tip “sare si piper". Citiţi şi intelegeti implementarea in 


C: 


void ImageViewer :: filtru median( void ) 
1 

int i, j; 

int w, h; 


int k, aux; 
int m, n; 

int med; 

int sir[ 9 ]; 


w = image.width(); 
h = image.height(); 


QImage image fil( w, h, 32, 0, QImage::IgnoreEndian ); 


for( i = 1; i < w-1; i++ ) 
for( j = 1; j < h-1; j++) 
í 
//formarea unui sir din elementele vecinatatii 3x3 
k = 0; 
for( m = -1; m < 2; m++ ) 
for( n = -1; n < 2; n++ ) 
í 
sir[k] = qRed( image.pixel( ізш, іп ) ); 
k++; 
) 


//ordonarea crescatoare a valorilor pixelilor 
//metoda BUBBLE SORT 


k = 0; 
while( k == O ) 
1 

k = 1; 


Ғог( m = 0; m < 8; m++ ) 
if( sir[ m ] > sir[m + 1 ] ) 
í 
aux = sir[ m ]; 
sir[ m ] = sir[ m + 1 ]; 
sir[ m + 1] = aux; 
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//elementul median 
med = sir[ 4 ]; 


//noua valoare a pixelului 
image fil.setPixel( i, j, qRgb( med, med, med ) ); 


image - image fil; 
pm = image; 
update() ; 


Problema 7. Implementati filtrul de minim. Observati efectele lui 
asupra unei imagini neafectate de zgomot. 

Problema 8. Implementati filtrul de maxim. Observati efectele lui 
asupra unei imagini neafectate de zgomot. 


Lucrarea 8 


Transformări unitare 


BREVIAR TEORETIC 


Transformările reprezintă. o categorie de prelucrări ce include operaţii de tip 
integral, la calculul noii valori a unui pixel al imaginii transformate con- 
tribuind valorile tuturor pixelilor din imaginea originală. 

Termenul de transformare se referă la o clasă de matrici unitare folosite 
pentru a reprezenta imagini. O matrice A de dimensiune N x N este unitară 
dacă inversa ei este matricea А%7; 


A- Al = A. AIT = AT. A= In (8.1) 
unde * reprezintă operaţia de complementare în mulţimea numerelor 
complexe, Т reprezintă operaţia de transpunere a unei matrici, iar Гу este 


matricea identitate de dimensiune N x N: 


1 0 0 0 
0 1 0 0 

jx 0.0 1 .. 0 (8.2) 
0.0 0 .. 1 


Pentru un vector uni-dimensional u de dimensiune N, de forma: 


К 


se numeşte transformare unitară directă relaţia: 
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v(k) — a(k,n)-u(n), 0<k<N-1 (8.4) 


unde v(k) reprezintă elementele vectorului transformat v, iar a(k, n) sînt 
elementele matricii A. Matricial aceastá relatie se poate scrie astfel: 
u=A-u (8.5) 


Transormarea unitară inversă este dată de relaţia: 


N- 
S a' (kon) O<n<N-1 (8.6) 
care se scrie matricial astfel: 


u-A'T.v (8.7) 


Valorile vectorului v sunt o reprezentare a vectorului initial u, intr-un alt 
spaţiu. O astfel de reprezentare este utilă in filtrare, compresie, extragere 
de trăsături sau alte tipuri de analiză a imaginilor. 


8.1  'Transformări unitare bidimensionale 


Pentru o imagine u(m,n), de dimensiune N x N, transformarea directă are 
următoarea. formă: 


-1М-1 


EO u(m,n):agi(m,n), Ok, Ix N -—1 (8.8) 


m=0 n=0 


iar transformarea inversă: 


u(m,n) = v(k,l) -akım n), OSmn<N-1 (8.9) 


unde coeficienţii {ар (т, т) } poartă numele de transformare unitară 
bidimensională, şi reprezintă un set de matrici de bază ortonormale, iar 
v(k,l) reprezintă transformata imaginii u(m, n). 

Aceste matrici de bază respectă condiția de ortonormalitate: 


E AH 
l, К=К'&1=1Ї, 
У У бышы). aj; (mn) = ó(k — ll) = E 0. HD 
(8.10) 


pentru Vk, l. 
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O transformare ca cea dată de relaţia (8.8) este caracterizată de N+ 
coeficienţi aj, (т, n). Pentru calculul unui singur element v(k,l) (k sil 
fixati) este nevoie de un număr de N? înmulţiri. Prin urmare complexitatea 
întregului calcul este O(N). Complexitatea, poate fi redusă la O(N?) dacă 
transformarea, este separabilă. 

O transformare este separabilă, dacă elementele ар (m, n) ce o definesc, 
pot fi scrise ca produs de alte două elemente, grupate după perechi de indici, 
astfel: 


акл(т, n) = az(m) - b(n) = a(k,m) - bU,n) (8.11) 


unde, matricile A = {a(k,m)} si B = (b(l,n)) trebuie sa fie la rândul 
lor unitare, adică: 


A. AIT = AIT. AS IN (8.12) 


B. BY = BY". B=Iy (8.13) 


Daca transformarea este separabila, atunci relatiile (8.8) si (8.9) devin: 


N-1N-1 
v(k,I) = > У a(k, т): u(m,n)  b(1,n) (8.14) 

m=0 n=0 

N-1N-1 
u(m,n) = X у a*(k,m)-v(k, 1)» b*(1,n) (8.15) 

k=0 k=0 

care pot fi scrise matricial astfel: 

V=A-U-B* (8.16) 
U-AT.y.p* (8.17) 


unde U = {u(m,n)} reprezintă imaginea originală, iar V = (v(k,l) 
reprezintă imaginea transformată. 

În practică se folosesc numai transformări separabile, pentru care, în 
plus, se alege B = A. În acest caz, vom avea, o singură matrice A, unitară, 
care defineşte transfomarea, iar relaţiile (8.14) şi (8.15) devin: 


N-1N-1 


= M So alk u(m, n) -a(l,n) (8.18) 
m=0 n=0 
N-1N-1 
Sa v(k, 1) -a*(1,n) (8.19) 
k=0 k=0 


Matricial, relaţiile (8.16) si (8.17) se scriu după cum urmează: 
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V=A:U. AT (8.20) 


U=AT.V. A (8.21) 


8.1.1 Proprietăţile transformărilor unitare 


In continuare vor fi prezentate câteva din proprietăţile transformărilor unitare. 


e O transformare unitară, conservă, energia semnalului. Această, propri- 


8.2 


etate o vom demonstra pentru cazul unei transformări unitare uni- 
dimensionale, pentru simplitate, deşi este perfect valabilă şi în cazul 
unei transformări bidimensionale. Fie u un semnal discret uni-dimensi- 
onal, format din № eşantioane, şi o transformare unitară, data de ma- 
tricea A. Relaţiile de transformare vor fi: 


Energia semnalului u este dată de norma la pătrat a spaţiului în care 
este reprezentat, semnalul: 


E, = |v]? = v** -v = (Au)! -Au = u*T A Au = aT -u = |u|? = E, 

(8.22) 
În general transformarea, se alege astfel încât energia să fie inegal dis- 
tribuită în spaţiul transformatei, chiar dacă ea era uniform distribuită, 
în spaţiul original. 


Entropia unui semnal discret cu valori aleatoare se conservă printr- 
o transformare unitară. Dar entropia este o măsură a cantităţii de 
informatie, ceea ce înseamnă că o transformare unitară păstrează infor- 
matia conținută în semnal. 


Coeficientii în spaţiul transformatei sunt decorelati sau aproape decore- 
lati. Transformata optimă care compactează maximum de energie într- 
un număr dat de coeficienţi şi care în acelaşi timp decorelează complet 
aceşti coeficienţi, este transformarea Karhunen-Loéve. 


Transformata Fourier discretă 


8.2.1 Transformata Fourier unidimensionalá 


Pentru un semnal unidimensional, u, de dimensiune N, de forma: 
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u = [u(0), u(1), ...,u(N — DJ? (8.23) 


transformarea Fourier directá este datà de relatia: 


. 2mjkn 


Nd 
vk) = У; u(n)-e N Vk=0.N-1 (8.24) 
n=0 


iar transformarea Fourieri inversă de relaţia: 


2rjkn 


u(n) = v(k)-e N Vn=0.N-1 (8.25) 


Astfel definită, transformarea Fourier nu este unitară. Următoarele 
relaţii definesc transformarea, Fourier unitară, directă şi inversă: 


N-1 
1 2njkn 
v(k) = — у u(n)-e N Vk=0.N-1 (8.26) 
N n=0 
N-1 
1 2тјкп 
и(п) = — v(k)-e N Vm = 0..№ – 1 (8.27) 


Е 
Dacă definim matricea F = {f(k,n)} a transformării, având elementele: 


1 2rjkn 

k,n) = —= N  k,n=0.N —1 8.28 
f(k,n) JN (8.28) 
atunci transformarea Fourier se poate scrie matricial astfel: 


v=F-u (8.29) 


u-F*. (8.30) 


Ie 


cu observaţia cá matricea F are următoarea proprietate: F = ЕТ, 
Pentru calculul transformatei Fourier discrete, există algoritmi rapizi 
(FFT!) care reduc complezitatea calculelor de la O(N?) la O(NlogN). 


8.2.2 Transformarea Fourier bidimensională 


Pentru o imagine U = {u(m,n)}m,n=0..N—-1, de dimensiune N х N, imaginea 
transformată V = (v(k,l) Yo. N-1 se calculează cu relaţia următoare, ce 
reprezintă. transformarea. Fourier în ipoteza separabilitatii: 


N-1N-1 


бы) = SS uom, m) ctm (8.31) 


m=0 n=0 


lFast Fourier Transform 
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iar transformarea Fourier inversă este dată de formula: 


E — 
У, 3 (k, 1) (8.32) 


{= 1-0 
Daca folosim matricea F definită cu relaţia (8.28), atunci matricial se 
poate scrie: 


V=F-U-F (8.33) 
U=F*.V-F* (8.34) 


8.3 Transformata cosinus discretă 


Transformata cosinus este o transformată unitară separabilă, definită, de 
matricea C = {c(k,n)}, ale cărei elemente sunt date de relația: 


Jm k=0,0<n<N-1 
(k,n) 2 (2n4l)rk (8.35) 
pcos sy > 1<k< N -1l0<n<N-1 


Transformata cosinus, directă si inversă, pentru un semnal unidimen- 
sional, este dată de relațiile: 


N-1 
v(k) = a(k) У u(n)cos EDE, О (8.36) 
n=0 


2 1 
ak n+ ME 


<n<N-1 . 
T. 0<п< (8.37) 


=, a(k) = ү. 1<k<N-1 (8.38) 


Transformarea cosinus bidimensionala, directa gi inversa, este data de 
urmatoarele doua relatii, scrise matricial: 


V=0.U.C7 (8.39) 


U=CT.U.C (8.40) 


deoarece matricea C are proprietatea cà C = С*, elementele sale fiind 
numere reale. 

Observatie: transformarea cosinus nu este partea realá a transformárii 
Fourier. 
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8.4 Transformata sinus discretă 


Transformata. sinus este o transformată unitară separabilă, definită de ma- 
tricea S = {s(k,n)}, ale cărei elemente sunt date de relaţia: 


s(,n) = Ju Тае г Ж Уо Ж. (8.41) 
үүт” N +1 


Relatiile ce definesc transformarea sinus unidimensionalá, directá si in- 
versă, sunt următoarele: 


N-1 
2 ‚ (k+ 1)(n + 1) 
k) = У МТА OXxkzxN-i1 (842 
v(k) Nap ze MUR NAI , 0<k< (8.42) 
N-1 
2 . (Kk E 1) n4 1)т 
-4/---- — U < z < — . 
u(n) NFI v(k)sin NEI „ 0<п<Л-1 (8.43) 


Transformarea sinus bidimensională, directă, şi inversă, se scrie matricial 
astfel: 


V=S-U-S (8.44) 


U=S-V-S (8.45) 


deoarece matricea 5 are proprietatea că S = S* = ST = 5-1, 
Observatie: Transformarea sinus nu este partea imaginara a transformarii 
Fourier. 


DESFASURAREA LUCRARII 


Problema 1. Pentru o imagine de dimensiune N x N, adica patrata, 
observati imaginea transformata obtinuta cu ajutorul transformatei cosi- 
nus bidimensionalá (functia transformata cosinus discreta din meniul 
Algoritmi). Codul acestei functii este prezentat in continuare: 


void ImageViewer :: transformata cosinus discreta( void ) 
1 

int w, h; 

int i, j, Kk; 

double pi = 3.1415926; 


w = image.width(); 
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h = image.height(); 


if( w == h ) 
{ 

int N = ы; 

double max = 0; 

double C[ N ][ N ]; 
//matricea transformarii cosinus 


int UL N IE N 1; 
//matricea imaginii in spatiul original 


double V[ N ][ N ]; 
//matricea imaginii in spatiul transformatei 


double AUX[ N ][ N ]; 


//formarea matricei C a transformarii cosinus discreta 
for( i = 0; i < N; ir) 
CL OIL il =1. / sqrt( її); 


for( i = 1; i < N; i++ ) 
for( j = 0; j < N; j++ ) 
1 
CL i ][ j 1 = sqrt( 2./N ) ж 
cos( рі ж ( 2zj + 1) * i / (2*N ) D); 


if( CL i ][ j ] > max ) 
max = C[ i ][ j ]; 


//formarea matricei U 
for( i = 0; i < N; ir) 
for( j = 0; j < N; j++ ) 
UL i ][ j ] = qRed( image.pixel( i, j )); 


//N = C*U*Ct 
//mai intii vom calcula AUX = C * U 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 
í 
AUX[ i ][ 11-0; 
for( k = 0; k < N; k++ ) 
AUX[ i IL j] += C[i][k] * UEE ][ j 1; 
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//apoi V = AUX * Ct 

max = 0; 

for( i = 0; i < N; it) 
for( j = 0; j < N; j++ ) 


í 
ҮГІ1І 11-0; 
for( k = 0; k < N; К++) 
VC i ]J[ j ] += AUXL i][k] *C[ j ][ k ]; 
if( VL i ][ j ] > max ) 
max = V[ i ][ j ]; 
} 


QImage transf( N, N, 32, 0, QImage::IgnoreEndian ); 


for( i = 0; i < N; it) 
for( j = 0; j < N; j++ ) 
í 
int niv = (int)( VL i ][ j ] * 255 / max); 
transf.setPixel( i, j, qRgb( niv, niv, niv ) ); 


image - transf; 
pm - image; 
update(); 


Problema 2. Implementati transformarea sinus bidimensională. 

Problema 3. Implementati transformarea Fourier bidimensionalá (nu- 
mai partea realá, care reprezintá spectrul de frecvente spatiale al imaginii). 

Problema 4. Verificati proprietatea de conservare a energiei pentru una 


din transformări. 
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Lucrarea 9 


Compresia imaginilor 


BREVIAR TEORETIC 


'Termenul de compresie se referà la totalitatea metodelor ce au drept scop re- 
ducerea cantităţii de date necesare pentru reprezentarea unei imagini. Com- 
presia este folosită in special pentru stocarea sau transmiterea imaginilor. 
Să considerăm cazul unei imagini de dimensiune 512 x 512 pixeli. Dacă 
aceasta este o imagine în tonuri de gri, iar fiecare pixel este codat cu 8 biţi, 
atunci cantitatea de date necesară pentru a reprezenta această imagine este: 


512 х 512 х 8=29 x 99 x 99 = 2X1 ~ 2 Mb 


Din acest calcul ne putem da seama că pentru a stoca o imagine avem 
nevoie de spaţiu considerabil, iar pentru transmiterea ei avem nevoie de un 
canal de transmisiune de bandă largă, de care nu dispunem întotdeauna. 


9.1 Clasificarea metodelor de compresie 


Metodele de compresie se pot clasifica astftel: 


e Metode de compresie la nivel de pixel 
Aceste metode nu tin cont de corelatia care există între pixelii vecini, 
codând fiecare pixel ca atare. Acest tip de compresie este fără pierdere 
de informaţie, adică imaginea iniţială poate fi refăcută perfect din 
imaginea comprimata. Exemple de astfel de metode: 


— codarea Huffman 
— codarea LZW (Lempel-Ziv-Walsh) 
— codarea RLE (Run Length Encoding) 


e Metode de compresie predictive 
Aceste metode realizeazá compresia folosind corelatia care existá intre 
pixelii vecini, dintr-o imagine. Exemple de astfel de metode: 
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— codarea cu modulatie “delta” 
— codarea DPCM (Differential Pulse Code Modulation) 


e Metode de compresie cu transformate 
Aceste metode se bazează pe scrierea imaginii într-o altă bază, prin 
aplicarea unei transformări unitare, atfel încât energia imaginii sa fie 
concentrată într-un număr cât mai mic de coeficienţi. 


e Alte metode de compresie 


— cuantizarea vectorială 
— codarea folosind fractali 


— codarea hibridă 


9.2 Algoritmul Huffman 


Să presupunem că valorile pixelilor unei imagini sunt simboluri ale unei surse 


©: 


[5] = (51,52, ..., SN J (9.1) 


pentru care se cunosc probabilitátile de aparitie: 


[P] = (pi, pa. DN] (9.2) 


P(S$1) 2p P(S2)=p2 P(SN)= рм (9.3) 


Aceste probabilitáti nu reprezintá altceva decát frecvetele relative de 
aparitie ale simbolurilor intr-un gir de simboluri emise de sursa 5. 
Entropia sursei $ care genereazá simbolurile se calculeazá cu formula: 


N 
H(S) = — Ур ` logpi (9.4) 
jc 


Ne propunem să сойдаш simbolurile sursei 5 cu simboluri ale unei alte 
surse (de exemplu o sursă care generează doar două simboluri: 0 şi 1), astfel 
încât entropia noii surse să fie maximizată. 

În continuare este prezentată o metodă care maximizează această en- 
tropie, metodă elaborată de Huffman în 1952: 

Pasul 1. Se ordonează descrescător probabilitățile p;. 

Pasul 2. Se formează un arbore binar, având ca frunze valorile celor 
mai mici probabilitati din şirul de probabilitati. Rădăcina acestui arbore 
va contine suma probabilităților celor două frunze ale sale. Se etichetează 
muchia stângă cu 1 şi muchia dreaptă cu 0. 
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Pasul 3. Din şirul P se eliminá cele două probabilitati care au fost alese 
ca fiind cele mai mici. In şirul P se introduce valoarea conținută de rădăcina 
arborelui binar format. 


Pasul 4. Dacă în şirul P există mai mult de un element, atunci se reia 
algoritmul, de la Pasul 1. 


Pasul 5. Codarea binară a fiecărui element se obţine prin parcurgerea 
arborelui ce s-a format, de la rădăcină spre fiecare frunză. 


Eficienţa, codificării Huffman este dată de lungimea medie Га cuvintelor 
de cod, care se calculează folosind formula: 


N 
1 = 3 1; “Di (9.5) 
i=1 


unde |; este lungimea codului alocat simbolului S;. 
Exemplu: 
Fie o sursă S care generează 4 simboluri, [S] = {a, b, c, d), care au următoarele 


probabilitati de apariţie: [P] = (0.2;0.4; 0.1;0.3}. Arborele codárii Huffman 
se construieste conform etapelor prezentate in Figurile 9.1, 9.2, 9.3 gi 9.4. 


Figura 9.1: Algoritmul Huffman: etapa 1. 


Figura 9.2: Algoritmul Huffman: etapa 2. 
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А, 
fe 


Figura 9.3: Algoritmul Huffman: etapa 3. 


Figura 9.4: Algoritmul Huffman: etapa 4. 


Pentru decompresie este necesara o tabela in care sa se memoreze cores- 
pondentele intre simboluri si cuvintele de cod. Fara aceasta decompresia 
este imposibil de realizat. 


Lungimea medie a cuvintelor de cod, pentru acest exemplu, este: 


4 
1= Ур: =0,2-3+0,4-1+0,1-340,3-2 = 1,9 bits/simbol 
1—1 


Dacà nu am fi codat simbolurile, їп vederea maximizárii entropiei sursei, 
ar fi fost nevoie de 2 biti/simbol pentru codare. 
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Pentru imagini, probabilitatile de aparitie ale nivelelor de gri se obtin 
prin calcularea histogramei imaginii. Daca histograma este uniforma, atunci 
algoritmul Huffman de codare nu este eficient, nerealizànd nici o imbunatatire 
a lungimii cuvintelor de cod. 


9.3 Algoritmul RLE 


9.3.1 Algoritmul RLE pentru imagini binare 


Vom considera valorile pixelilor (0 sau 255) ca fiind simbolurile 0 şi 1 generate 
de o sursă binară. In vederea codării imaginea, este transformată într-un şir 
unidimensional, prin concatenarea liniilor sau a coloanelor, ca în Figura, 9.5. 


LI 
12 

E: е ie 7 
Ln 


Figura 9.5: "Transformarea imaginii într-un sir unidimensional, prin con- 
catenarea liniilor. 


Acest, şir de elemente 0 si 1 va fi codat, codarea realizându-se astfel: 
primul element al şirului codat este primul element din şirul de codat; apoi 
se scrie în şirul codat lungimea fiecărui subsir constant din şirul de codat. 


Exemplu: 
şirul de codat: 00000001111100011000000000101000111111111111 
şirul codat: 075329111312 


Acest tip de codare se foloseşte în special pentru comprimarea imaginilor 
transmise prin fax. 

Decompresia se face similar cu compresia, parcurgând şirul codat si 
generând şiruri alternate, de simboluri 0 sau 1, începând cu primul ele- 
ment din şirul codat, şi de lungimi indicate de valorile întâlnite în şirul de 
decodat. 


9.3.2 Algoritmul RLE pentru imagini în tonuri de gri 


Pentru imagini în tonuri de gri, algoritmul RLE se aplică pentru plane for- 
mate din bitii de pe aceeaşi poziţie, din reprezentarea binară a valorilor 
pixelilor. De exemplu, dacă imaginea în tonuri de gri, are 256 de nivele de 
gri, corespunzător la o cuantizare pe 8 biţi, atunci din această imagine se 
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construiesc 8 plane (sau 8 imagini binare) astfel: o imagine binará formatà 
din biții bo, о altă imagine binară din bitii b1, s.a.m.d. (vezi Figura 9.6). 


Figura 9.6: Transformarea unei imagini cu 256 nivele de gri, in 8 imagini 
binare. 


Valoarea pixelului (i, j) din imaginea in tonuri de gri va fi reprezentată 
pe 8 biti astfel: 


val(i, j) = [обл b2b3b4b5b6b7] 


unde bo este cel mai semnificativ bit (MSB!), iar by este cel mai putin 
semnificativ bit (LSB?). 

Imaginea binară formată din bitii cei mai semnificativi va fi comprimatá 
cel mai bine cu algoritmul RLE. Imaginea binará formatá din bitii cei mai 
puţin semnificativi va fi o imagine cu “purici”, pentru care se poate lua 
decizia de a nu mai fi codatá şi deci ignorată. 


9.4 Compresia cu transformate 


Compresia cu ajutorul transformatelor se bazează pe proprietatea acestora 
de a compacta energia imaginii într-un număr redus de coeficienţi, cât mai 
decorelati, repartizaţi neuniform în spaţiul transformării. 

Formula care defineşte o transformarea directa este următoarea: 


V=A-U. AT (9.6) 


unde A este matricea ce defineşte o transformare unitară, separabilă. 

Pentru compresia imaginilor, transformarea cea mai apropiată din punct 
de vedere al performanţelor de transformarea optimă Karhunen-Loéve, este 
transformarea, cosinus. Coeficientii de energie mare sunt situaţi în colţul 


! Most Significant Bit. 
?Least Significant Bit. 
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В 


Figura 9.7: Transformarea directă. 


din stânga-sus al imaginii 2. іп cazul іп care ве foloseste pentru 
compresie transformarea cosinus (vezi Figura 9.7). 


IL, 


Figura 9.8: Anularea coeficienţilor de energie mică. 


Pentru a obţine o rată de compresie mai mare, vor fi anulati coeficienţii 
de energie mică (vezi Figura 9.8). Anularea acestor coeficienţi va duce, însă, 
la scăderea calităţii imaginii după decompresie. Adică, prin transformare 
inversă (vezi Figura, 9.9), imaginea obţinută din imaginea V, nu va fi exact 
imaginea originală U. 


A A 
V U 


Figura 9.9: Transformarea inversă. 


Û = AT. V. A* (9.7) 
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Compresia cu transformarea cosinus stá la baza algoritmului JPEG? de 
compresie a imaginilor. 


DESFĂŞURAREA LUCRĂRII 


Problema 1. Implementati in C unul dintre algoritmii prezentaţi (Huff- 
man sau RLE). Pentru simplitate, imaginea citită în format BMP, va fi 
scrisă într-un format simplificat (vezi funcţia write naked image, din me- 
niul Algortimi). Imaginea comprimatá va fi scrisă într-un fişier cu exensia 
.huf sau .rle. 


void ImageViewer :: write naked image( void ) 
1 

int i, j; 

int w, h; 

FILE *file; 


w = image.width(); 
h = image.height(); 


file = fopen( "naked.img", "w" ); 
if( file != NULL ) 


1 
for( i = 0; i < w; i++ ) 
1 
for( j = 0; j < h; j++ ) 
{ 
int niv = qRed( image.pixel( i, j ) ); 
//nivelul de gri al pixelului 
fprintf( file, "43d ", niv); 
} 
fprintf( file, "Nn" ); 
) 
fclose( file ); 
) 


Problema 2. Calculati raportul de compresie obţinut, ca raport dintre 
dimensiunile celor două fişiere: cel original (naked. img) în formatul simpli- 
ficat şi cel comprimat. 


3 Joint Photographic Experts Group. 
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Problema 3. Observati efectul suprimárii coeficienţilor de energie joasă, 
la o compresie-decompresie folosind transformata cosinus discreta. (functia 
compresie decompresie.cu.DCT, din meniul Algoritmi). Pentru aceasta 
vizualizati imaginea decompresata.bmp. Codul prezentat in continuare pre- 
supune cá imaginea este pátratà: 


void ImageViewer :: compresie десошргевіе cu DCT( void ) 
1 

int w, h; 

int i, 1, K; 

double pi - 3.1415926; 


w = image.width(); 
h = image.height(); 


int N = w; 
double max; 
double C[N ] 


[ N //matricea transformarii cosinus 
double U[N ][ N 
[N 
[ 


; 
; //imaginea in spatiul original 
; //imaginea in spatiul transformatei 


Js 


] 

] 
double V[N ] ] 
double AUX[ N ][ N 
// COMPRESIA IMAGINII 
//formarea matricei C a transformarii cosinus discreta 
for( i = 0; i < N; i++ ) 

C[O0][ i] = 1. / sort( N 24 


for( i = 1; i < N; i++ ) 
for( j = 0; j < N; j++ ) 
CL i ][ j 1 = sort( 2./N ) ж 
cos( рі ж (2j + 1) * i / ( 2*N ) ); 


//formarea matricei U 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ ) 
UL i ][ j ] = qRed( image.pixel( i, j )); 


//V = C*U*Ct 
//mai intii vom calcula AUX = C ж U 
for( i = 0; i < N; i++ ) 
for( j = 0; j < N; j++ D 
1 
AUX[ i JD 05 
for( k = 0; k < N; k++ ) 
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AUX[ i][ A +s CE ас Je U[ k ][ j 1; 
} 


//apoi V = AUX * Ct 
max = 0; 
for( i = 0; i < N; itt) 
for( j = 0; j < N; j++ ) 
í 
v[ i ][ 11-0; 
for( k = 0; k < N; k++ ) 
V[i][ j ] += AUXLi ][k] *C[ j ][ к ]; 


if( V[ i][ j ] > max ) 
max = V[ i ][ 11; 
} 


//anularea coeficientilor 
//in vederea maririi factorului de compresie 
for( i = 0; i < N; itt) 

for( j = 0; j < N; j++ ) 


í 
if( v[ i ][ j ] < 100) //pragul de anulare 
v[ i][ 11-0; 
//alte valori prag: -500, -100, 0, 100, 500 
} 


// DECOMPRESIA IMAGINII 

//U = Ct * V * C 

//AUX = Ct * V 

for( i = 0; i < N; itt) 
for( j = 0; j < N; j++ ) 


í 
AUXL i ][ j ] = O; 
for( k = 0; k < N; k++ ) 
AUXL i][ jJ] t= C[k ][ i] * V[ K ][ j 1; 
} 


//apoi U = AUX * C 
for( i = 0; i < N; itt) 
for( j = 0; j < N; j++ D 
í 
U[ i ][ 11-0; 
for( k = 0; k < N; k++ ) 
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U[i][ j ] += AUX[ i][ k] ж C[ k ][ 1; 
//pseudo-imaginea diferenta 
QImage diff( N, N, 32, O, QImage:: IgnoreEndian ); 


for( i = 0; i < N; i++) 
for( j = 0; j < N; j++ D 


1 
int dif = abs( qRed( image.pixel( i, j) ) - 
Cint) ¢ UE 3 IE 3-3. 2-25 
diff.setPixel( i, j, qRgb( dif, dif, dif ) ); 
} 


iio.setImage( diff ); 
iio.setFileName( "diferenta.bmp" ); 
iio.setFormat( "BMP" ); 
iio.writeO; 


Problema 4. Calculati eroarea pátraticá medie (=) dintre imaginea 
originalá si imaginea obtinutá prin compresia si decompresia cu transformatá 
cosinus discretă, folosind formula: 


а= == | [u(4 j) — v(i, 3)? 


Pentru aceasta modificati functia Compresie-decompresie cu DCT. Ob- 
servati valorile erorii medii pátratice pentru diverse valori ale pragului de 
anulare a coeficienţilor in spaţiul transformării. 

Problema 5. Observati pseudo-imaginea diferenţă, dintre imaginea 
originală şi cea obţinută prin compresia şi decompresia cu DCT, pentru 
diferite valori ale pragului (vezi fişierul diferenta. bmp). 
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Lucrarea 10 


Segmentarea imaginilor 


BREVIAR TEORETIC 


Segmentarea reprezintă. împărţirea imaginii in zone de interes, după anu- 
mite criterii. Fiecárui pixel i se va atribui o valoare, 0 sau 1, reprezentànd 
apartenenţa acestuia la o anumită zonă sau regiune de interes. De regulă, 
segmentarea urmăreşte extragerea, identificarea sau recunoaşterea unui an- 
umit obiect dintr-o imagine. Zonele sau regiunile care alcătuiesc o ima- 
gine poartă numele de segmente. Pentru o imagine f(m,n), segmentarea 
reprezintă împărţirea lui f într-un număr N de zone f;(m,n), cu i = 1..N, 
ca în Figura 10.1. Aceste segmente se numesc complete, dacă au următoarele 
proprietăţi: 


e f, = 0 pentru í Z j, 
N 
. U fi == Í, 
i=l 
e segmentul f; sa fie compact, pentru Vi, 


e pentru Vi, un anumit criteriu de uniformitate E(f;) este satisfácut, 


e pentru Vi, j, citeriul de uniformitate pentru f:l f; nu este satisfăcut. 
Metodele de segmentare a imaginilor se pot clasifica in: 


e metode de segmentare orientate pe regiuni 


e metode de segmentare orientate pe contururi 


10.1 Segmentarea orientată pe regiuni 


In general, operaţia, de segmentare orientată pe regiuni urmăreşte extragerea 
din imagine a zonelor (regiunilor) ocupate de diversele obiecte prezente 


81 


82 LUCRAREA 10. SEGMENTAREA IMAGINILOR 


Figura 10.1: Exemplu teoretic de segmentare. 


in scenà. Un obiect se defineste ca o entitate caracterizatá de un set de 
parametri ale cáror valori nu se modificá in diferitele puncte ce apartin 
entitátii considerate. Unul dintre cei mai simpli parametri de definitie este 
nivelul de gri al pixelului. Dacá nivelul de gri caracterizeazà in mod suficient 
obiectele din imagine, atunci histograma imaginii va prezenta o structurá de 
moduri dominante - adică de intervale de nivele de gri ce apar cu probabili- 
tate mai mare. Fiecare mod al histogramei va reprezenta cáte un obiect sau 
o categorie de obiecte. 


10.1.1  Práguirea histogramei 


Separarea modurilor histogramei, si deci identificarea obiectelor din imagine, 
se face prin alegerea unor nivele de gri, numite praguri de segmentare. De 
obicei aceste praguri se aleg ca fiind corespunzătoare minimelor locale ale 
histogramei. Din imaginea iniţială, f se construieşte o imagine de etichete g 
(imagine etichetată), conform unei transformări de forma: 


_ Eo, 0x f(m,n) < Тк-і 
Іп cazul unei histograme bimodale (care contine douá moduri domi- 
nante), ca cea din Figura 10.2(a), transformarea de mai sus devine: 


Eo, 0< f(m,n)<T 

= =: 10.2 

gm,n) I E, T<f(mn)<L we 

asemănătoare cu operaţia de binarizare. O astfel de histogramă bi- 

modala este caracteristicá imaginilor ce contin un singur obiect sau mai 

multe obiecte de acelaşi fel, pe un fundal uniform. De exemplu, o imagine 
care conţine un scris negru pe un fond alb. 
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Figura 10.2: Histograma: (a) bimodala; (b) cu trei moduri dominante. 


10.1.2 Segmentarea prin creştere de regiuni 


Principiul pe care se bazează creşterea regiunilor este următorul: se aleg in 
imagine pixeli reprezentativi pentru fiecare obiect individual, pe baza cărora 
are loc un proces de aglomerare a pixelilor vecini acestora, ce au aceleaşi 
proprietăţi cu pixelii reprezentativi. În urma acestui proces de aglomerare 
se obţin zone de pixeli cu aceleaşi caracteristici. 


Procesul se opreşte în momentul în care fiecare pixel al imaginii a fost 
alocat unei regiuni. Metoda are două etape esenţiale: alegerea punctelor de 
start (puncte iniţiale), numite germeni sau seminţe, şi creşterea propriu-zisă 
a regiunilor. Numărul final de regiuni rezultate este egal cu numărul de 
germeni aleşi iniţial pentru creştere. În principiu, este de dorit ca fiecare 
obiect individual aflat in imagine, să fie marcat de un germene. Daca în 
interiorul unui obiect se găsesc mai mulţi germeni, pentru fiecare dintre ei 
va fi crescută. o regiune, fapt ce duce la o segmentare artificială nedorită 
a obiectului respectiv. Acest neajuns poate fi corectat printr-o etapă de 
fuziune a regiunilor adiacente ce au proprietăţi asemănătoare. 

Daca în interiorul unui obiect nu este ales nici un germene, atunci obiec- 
tul respectiv va fi inclus în regiunile ce cresc pornind de la germeni din 
vecinătatea, sa. 


10.2  Segmentarea orientată pe contururi 


Într-o imagine, variațiile de nivel ale ріхеШог reprezintă schimbări ale pro- 
prietátilor fizice sau geometrice ale obiectelor ce compun scena. Într-un 
număr mare de cazuri, aceste variaţii de intensitate corespund frontierelor 
(contururilor) regiunilor determinate de obiectele dintr-o imagine. 
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10.2.1 Tehnicile de gradient 


Principiul acestor metode constă în definirea punctelor de contur ca fiind 
acei pixeli ai imaginii pentru care apar schimbări abrupte ale nivelului de gri. 
Măsurarea acestor variaţii se face prin operatori derivativi de tip gradient. 
Derivata. imaginii pe direcţia r, ce face unghiul 0 cu orizontala, este data de 
combinaţia liniară a derivatelor parţiale pe direcţiile orizontală şi verticală: 


Of OfOrv Of dy Of Of . 
a orr 90 Әг = 5, 050 + oy sind (10.3) 
9f = fs=cos0 + f, sin (10.4) 


ór — 
Valoarea maximă a acestei derivate, calculate după unghiul 0 este deter- 
minata de ecuaţia: 


д (ƏfN : З 
88 (35) = — f,sin0 + f,,cos0 = 0 (10.5) 
care are solutia: 
ú i 
6 = arctan | — (10.6) 
fy 


Pe această direcție, modulul gradientului este: 


Din punct de vedere practic, implementarea acestei metode implicá cal- 
cularea, pentru fiecare pixel al imaginii, a derivatelor parțiale f, si fy, cal- 
cularea modulului gradientului maxim si a direcției acestuia. Valoarea gra- 
dientului maxim din fiecare pixel al imaginii este apoi comparată o valoare 
de prag: dacă pragul este depăşit, atunci pixelul este considerat a fi pixel de 
contur. Realizarea derivatelor parțiale după direcțiile orizontală şi verticală 
implică formularea discretă a lui fa si fy: 


_ Of _ Af(m,n) 


Ј = OR A (10.8) 
_ Of _ Af(m,n) 
= 00. А (10.9) 


Aceste derivate parţiale discrete pot avea mai multe implementări: 


Ј = f(m,n) — f(m+1,n) fy = f(m,n) — f(m,n + 1) (10.10) 
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fe = f(m- 1,n) = f(m,n) fy = f(m,n-1)-— f(m,n) (10.11) 


fe = f(m—1,n) – f(m+1,n) fy = f(m,n—1)— f(m,n+1) (10.12) 


Aceste expresii nu reprezinta altceva decat combinatii liniare ale valorilor 
unor pixeli din imagine, situati in vecinátatea pixelului curent din pozitia 
(m,m). Prin urmare, se pot implementa folosind urmátoarele másti de 
filtrare: 


W,=(1 œ egy Wwe 
-1 


unde prin * am marcat originea mastii de filtrare. O simplificare uzuală 
practică, este dată de aproximarea: 


Of " 
(Z) млі (10.13) 


Folosirea mástilor de derivare pe verticalá si orizontalá prezentate are 
însă serioase neajunsuri: dimensiunea lor mica face ca rezultatele să fie 
extrem de sensibile la zgomote. În aceste condiţii a apărut ideea naturală 
de a combina filtrarea de derivare cu o filtrare de netezire, care să reducă 
efectele zgomotului. Ceea ce rezultă pentru operatorii de derivare orizontală, 
şi verticală sunt mastile: 


0 —1 1 с 1 
W,= | с 0° ce W = 0 0* 0 (10.14) 
1 0 -1 —1 —c -1 


Prin particularizarea valorilor constantei c se pot obtine diverse tipuri de 
operatori de extragere de contur clasici: Prewitt (c = 1), Izotrop (c = V2) 
sau Sobel (c — 2). În Figura 10.3 puteţi observa efectele extragerii de contur 
folosind operatorul Sobel. 


86 LUCRAREA 10. SEGMENTAREA IMAGINILOR 


(b) 
Figura 10.3: Filtrul Sobel: (a) imaginea originalá; (b) imaginea rezultatà. 


10.2.2 Operatorii compas 


Un operator compas este definit de un numár de másti de derivare, co- 
respunzátoare unor filtrári liniare, pe directiile principale (verticalá, orizon- 
talá şi cele două diagonale), în cele două sensuri. Compasul clasic are D = 8 
măşti de filtrare, fiecare dintre ele realizând o derivare după o direcţie mul- 
tiplu de 45°. Un exemplu de măşti de derivare directionalá sunt mastile 
următoare, indexate după direcţia geografică pe care se calculează derivata: 


-1 -1 -1 —1 -1 0 
Ww = 0 0 0 Wav = —1 0 1 
1 1 1 0 1 1 
—1 0 1 0 1 1 
Wy = —1 0 1 Wsy = —1 0 1 
—1 0 1 —1 -1 0 
1 1 1 1 1 0 
Ws = 0 0 0 Wsg- 1 0 -1 
-І -1 -1 0 —1 -1 
10 —1 0-1 -1 
Wg = 1 0 —1 WNE = 1 0 -1 
10 -1 1 1 0 


Dupa ce se vor calcula, pentru fiecare pixel in parte, cele opt valori ale 
gradientilor, corespunzatoare celor opt màsti de derivare: 


fi(m,n) fo(m,n) .. fg(m,n) (10.15) 
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se va determina valoarea maximă dintre aceste opt valori. Această va- 
loare va fi comparată cu valoarea de prag, iar în cazul în care este mai mare, 
pixelul respectiv va fi considerat pixel de contur. 


10.2.3 Identificarea trecerilor prin zero ale celei de-a doua 
derivate 


Unul dintre principalele dezavantaje ale metodelor de gradient este pre- 
cizia slabă de localizare a conturului în condiţiile unei pante puţin abrupte 
(tranziţii slabe, graduale) a acestuia. Derivata а doua poate fi însă folosită, 
pentru a marca centrul tranziţiei (trecerea sa prin zero). Operatorul bazat 
pe trecerea prin zero a derivatei secunde este operatorul “zero-crossing”. In 
cazul imaginilor, derivata secundă trebuie luată în considerare după ambele 
direcţii, combinate în laplacian: 


Af=— +— (10.16) 


Іп continuare sunt prezentate trei másti ce implementeazá o derivatá 
secundá bidirectionalá (operator Laplace): 


1 1 1 1 fa 5-4) sl 
0 —4 0 пола ^8 8 ^8 
1 1 1 1 1 1 
-3 Í 4 -3 1 -3 — 1 -3 
1 1 1 1 1 _1 _1 

0 + 0 4 DES ^8 8 ^8 


Pentru fiecare pixel din imagine se va calcula derivata a doua gi dacá 
aceasta este zero, atunci pixelul este considerat ca fiind pixel de contur. 


DESFÁSURAREA LUCRÁRII 


Problema 1. Implementati segmentarea prin praguirea histogramei. 
Pentru aceasta veti folosi codul de la lucrarea nr. 4 (egalizarea histogramei) 
şi imaginea tools. bmp. 

Problema 2. Observati extragerea contururilor prin tehnici de gradient, 
folosind un operator Prewitt. 


void ImageViewer :: extragere contururi( void ) 
1 

int i, j; 

int k, 1; 


int w, h; 
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int g, gi, g2; 
int hi[ 3 113 ], h2[ 3 ][ 3 ]; 


//operatori Prewitt 

h1[0] [0] = -1; Һ1[0][11] = 0; Mh1[0][2] = 1; 
h1[1] [0] = -1; hb1i[1][1] = 0; h1i[1][2] = 1; 
h1 [2] [0] h1[2] [1] = 0; h1[2][2] = 1; 


1 

I 
= 

we 


h2[0][0] = -1; h2[0][1] = -1; h2[0][2] = -1; 
h2[1] [0] = 0; h2[4][1] = 0; h2[1][2] = O; 
h2[2] [0] h2[2] [1] = 1; h2[2][2] = 1; 


1 
= 
we 


W 
h 


image.width(); 
image.height(); 


QImage image_ext( w, h, 32, 0, QImage::IgnoreEndian ); 


for( i = 1; i <w- 1; i++) 
for( j = 1; j< h- 1; j++) 
{ 
gl = 0; 
g2 = 0; 


for( k = -1; k < 2; k++ ) 
for( 1 = -1; 1 < 2; l++ ) 
ні 
gi += hi[k+1][ 1 +1] 
ж qRed( image.pixel( i+k, j*1 )); 
g2 += h2[k +1][ 1 + 1 ] 
ж qRed( image.pixel( i+k, ј+1 )); 
} 


g = abs( gl ) + abs( g2 5; 


if( g > 100) 

image_ext.setPixel( i, j, qRgb(255,255,255) ); 
else 

image ext.setPixel( i, j, qRgb(0,0,0) ); 


image = image_ext; 
pm = image; 
update(); 
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Problema 3. Implementati operatorul Izotrop de extragere a contu- 
rurilor. 

Problema 4. Implementati operatorul Sobel de extragere a contu- 
rurilor. 

Problema 5. Implementati operatorul compas dat drept exemplu. 

Problema 6. Implementati extragerea de contururi prin identificarea 
trecerilor prin zero ale derivatei secunde. 

Problema 7. Implementati creşterea de regiuni, pornind de la un singur 
germene. Veţi folosi pentru aceasta imaginea tools. bmp. 
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